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超级 畅销 书 《 大 话 设 计 模 式 》 作 者 程 术 三 年 磨 一 剑 推出 大 话 第 二 季 ， 
以 一 个 计算 机 教师 教学 为 场景 ， 讲 解数 据 结 构 和 相关 算法 的 知识 。 


《大 话 数据 结构 》 是 一 本 关于 数据 结构 和 算法 的 自学 读物 ， 全 书 模拟 
上 上课 场景 ， 让 一 个 说 话 有 趣 的 老师 来 和 同学 们 交流 数据 结构 知识 。 它 
不 板 着 脸 灌 输 ， 它 期 望 和 读者 做 朋友 ， 在 每 每 的 会 心 一 笑 中 ， 只 是 六 
入 了 读者 脑海 ， 化 为 读者 自己 的 本 领 。 它 是 这 么 做 的 一 一 


1、 一 图 值 千 言 。 作 者 精心 设计 了 多 幅 结 构 独 符 的 图 片 ， 充 分 运用 图 形 
语言 来 体现 抽象 内 容 ， 力 求 让 读者 通过 图 形 的 直观 表达 ， 更 高 效 地 换 
取 数 据 结构 的 知识 。 


2、 善 于 打 比 方 。 世 界 上 很 多 道理 都 是 相通 的 。 精 心 构思 的 类 比 能 让 人 
发 出 “原来 如 此 ”的 感 疏 。 读 者 会 发 现 ， 枯燥 的 数据 结构 知识 表 后 ， 也 
隐藏 着 一 个 个 生活 中 的 小 故事 。 


3、 细 致 深入 ， 适 合 自学 。 作 者 对 数据 结构 涉及 到 的 一 些 经 典 算法 进行 
了 逐 行 分 析 ， 并 进行 了 多 算法 比较 。 


本 书 适合 学 过 一 门 编 程 语言 的 如 下 读者 : 
在 读 的 大 中 专 计算 机 专业 学 生 ; 
， 想 转行 做 开发 的 非 专 业 人 员 ; 


KET ARE Dy ERR ΛΠ; 

© 工作 后 需要 补 学 或 温习 数据 结构 和 算法 的 程序 员 。 
BJ ΕΙ 

本 书 起 因 


大 家 好 ! 我 是 《大 话 设计 模式 》 (2008 年 初出 版 ， 的 作者 ， 三 年 来 ， 
承蒙 广大 读者 的 厚爱 ，《 大 话 设计 模式 》 取 得 了 较 大 的 成 功 。 仅 在 当 
当 网 ， 和 截止 本 文 写作 时 ， 就 已 经 有 1073 次 评论 ，705 次 5 星 评 价 ， 位 届 
五 星 图 书 榜 计 算 机 /网 络 类 的 累计 总 榜 第 二 名 。 此 书 已 经 成 为 国内 原创 
计算 机 类 图 书 最 畅销 的 书籍 之 一 。 


对 于 这 样 一 个 目 己 喜欢 做 、 可 以 做 得 好 ， 而 且 已 经 得 到 了 市 场 广泛 认 
可 ， 为 很 多 朋友 提供 帮助 的 事情 ， 我 没有 理由 不 去 继续 做 下 去 。 这 下 
征 我 准备 再 写 书 的 原因 。 


我 曾 做 过 调查 ， 数 据 结构 的 学 习 着 大 多 都 有 这 样 的 感慨 : 数据 结构 很 
重要 ， 一 定 要 学 好 ， 但 数据 结构 比较 抽象 ， 有 些 算法 理解 起 来 很 困 
难 ， 学 得 很 素 。 可 我 更 希望 传达 这 样 的 信息 : 数据 结构 非常 有 趣 ， 很 
多 算法 是 智 芒 的 结晶 ， 学 习 它 是 去 奈 受 计算 机 编程 技术 的 魅力 ， 在 理 
解 掌握 它 的 同时 ， 整 个 过 程 都 是 一 种 愉悦 的 精神 感受 ， 而 非 枯燥 乏味 
的 一 门 课程 。 因 此 我 决定 写作 一 本 关于 数据 结构 有 趣 的 书 。 


不 过 现实 总 比 理想 来 得 更 “现实 ?。 要 想 把 书写 好 ， 谈 何 容易 ， 我 需要 
突破 很 多 困难 ..…. 喀 ! 不 管 如 何 ， 现 在 您 看 到 了 本 书 ， 那 束 说 明 我 已 
经 区 服 了 困难 战胜 了 目 己 。 和 而 望 您 可 以 喜欢 上 这 本 书 。 


本 书 定位 
本 书 的 定位 束 生 一 本 过 合 读者 目 学 数据 结构 的 书籍 ， 它 有 区 别 于 教 
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通常 讲解 数据 结构 的 图 书 都 是 以 教材 的 方式 呈现 。 在 写作 前 ， 我 购买 
或 在 图 书馆 借阅 了 十 几 本 非常 好 的 数据 结构 相关 教材 用 来 为 写作 本 书 
ο ο CHAS SER 
学 "读物 。 


我 没有 轻视 这 些 好 书 的 意思 ， 不 过 教材 和 目 学 读物 ， 所 面向 的 读者 是 
完全 不 同 的 。 


好 的 教材 应 该 是 捉 纲 过 领 、 重 点 突出 ， 一 定 要 留 出 思考 的 空间 ， 人 否则 
台 没 必要 再 听 老 师 上 读 了 。 很 多 内 容 的 讲解 生 由 老师 在 课 竺 完成 ， 教 
材 中 有 练习 、 课 后 习题 、 思 考题 等 ， 这 些 大 多 可 以 通过 老师 来 解答 。 
比如 我 们 中 学 时 的 语文 、 数 学 读本 ， 很 浒 的 一 本 书 通 音 要 用 一 学 期 、 
甚至 一 年 的 时 间 来 学 习 ， 这 束 是 因为 它们 走 教 材 而 不 是 目 学 读物 。 如 
果 是 小 说 ， 可 能 一 两 天 束 读 完了 。 


好 的 目 学 读物 的 目标 是 让 初学 者 “ 独 目 ” 全 一 掌握 知识 ， 需 要 强调 “ 独 

目 ” 一 词 ， 这 束 况 明 读者 在 阅读 时 ， 征 完全 依靠 目 己 的 力量 来 同 末 知 发 
出 挑 成 。 因 此 书 中 内 容 ， 要 么 不 写 ， 写 了 束 应 该 写 透 。 如 采 读 者 在 阅 
读 时 总 十 疑惑 重重 ， 那 么 这 本 书 束 有 很 大 的 问题 了 。 


我 也 惑 是 在 基于 这 样 的 认识 ， 决 心 将 《大 话 数据 结构 》 真 正 写成 一 本 
天 于 数据 结构 和 算法 的 目 学 读物 来 展开 写作 的 。 


本 书 特色 
1. 趣味 引导 


大 部 分 的 编程 类 图 书 ， 在 内 容 上 基本 都 是 直 奔 主题 。 但 是 尼采 曾 说 

过 : “人 们 无 法 理解 他 没有 经 历 过 的 事情 。” 换 句 话说 ， 我 们 只 接受 过 
去 早已 理解 的 事物 相关 的 信息 。 这 是 一 种 比较 学 习 过 程 ， 在 这 个 过 程 
中 ， 大 脑 寻找 每 条 信息 之 间 的 联系 。 所 以 教育 专家 普 衣 认为， 吸引 学 
生 的 注意 力 ， 比 较 好 的 办 法 是 用 他 们 比较 熟知 的 知识 开始 。 


因此 在 本 书 中 ， 我 会 用 一 个 故事 、 一 个 趣味 题目 、 一 部 电影 的 介绍 等 
形式 来 作为 每 一 章 甚至 很 多 小 节 的 开头 ， 选 择 的 内 容 也 多 多 少 少 与 要 
讲 的 主题 内 容 相 关 。 这 并 不 是 多 余 ， 而 是 有 意 为 之 。 事 实 上 ， 这 样 的 
形式 在 我 的 前 一 本 书 中 已 经 得 到 了 普 遇 认可 。 


2. ΚΠΣ 


西方 有 人 句 谚 语 ,， “A picture is worth a thou-sand words. 〈 一 图 值 千 
3) ”。 用 上 千 个 字 描 述 不 明白 的 东西 ， 很 可 能 一 张 图 就 能 解释 清楚 。 


我 非常 认可 这 个 观点 ， 所 以 本 书 虽 没有 达到 每 一 页 都 有 匈 ， 但 基本 做 
到 了 绝 大 部 分 讲解 都 有 相关 图 示 ， 关 键 算法 更 是 通过 多 图 逐步 分 解剖 
析 。 尽 管 这 市 来 了 写作 上 的 难度 ， 但 却 可 以 达到 较 好 的 效果 。 毕竟， 
读者 通过 本 书 开始 学 习 数 据 结构 时 ， 要 从 一 无 所 知 或 略 知 一 二 到 完全 
理解 ， 甚 至 掌握 应 用 ， 是 需要 一 个 比较 艰 藻 的 过 程 ， 用 大 量 的 图 示 可 
以 减少 这 个 过 程 的 长 度 。 


3. 代码 详解 


我 在 写作 中 尽量 握 弃 了 传统 数据 结构 教材 的 “ 重 理论 思想 而 轻 代码 讲 
解 ” 的 作法 。 在 准备 数据 结构 写作 时 我 发 现 ， 很 多 教材 对 数据 结构 理论 
和 算法 设计 思想 讲 得 比较 好 ， 可 一 到 实际 代码 时 ， 有 的 把 代码 贴 出 来 
加 少量 注释 ， 有 的 直接 用 伪 代 码 形式 。 这 对 于 上 课 的 学 生还 好 ， 毕 竟 
有 老师 在 课 特 中 去 详解 代码 编写 原理 ， 可 是 对 于 初学 数据 结构 和 算法 
的 目 学 者 而 言 ， 如 琳 书 中 不 去 解释 代码 某 些 细 方 为 什么 那样 编写 的 原 
因 ， 甚 至 代码 根本 不 可 能 在 某 个 编译 右 中 运行 通过 ， 其 挫折 感 是 很 强 
烈 的 。 比 如 即使 理解 了 图 结构 中 的 最 短路 径 求解 原理 ， 也 可 能 无 法 写 
出 最 短路 径 的 算法 。 


我 把 代码 在 运行 过 程 中 变量 的 变化 融入 到 整个 算法 设计 思想 的 讲解 
中 ， 配 合 相 应 的 示意 图 ， 会 帮助 大 家 更 加 容易 理解 算法 的 实质 。 这 种 
讲解 模式 在 本 书 的 第 6、7、8、9 章 的 很 多 复 洒 算法 中 有 上 有 具体 体现 ， 越 
τ. σος 个 特色 ， 硕 望 对 读者 有 
帮助 ο 


4. 形式 新 颖 


我 把 本 书 的 内 容 虚 构成 了 一 个 老师 上 诬 的 场景 ， 所 有 内 容 部 通过 这 位 
老师 表达 出 来 ， 书 中 的 文字 非常 口语 化 ， 这 样 做 的 目的 是 为 了 更 加 直 
观 地 让 读者 感觉 ， 目 己 是 在 学 习 ， 是 在 上 课 。 有 人 可 能 会 说 ， 现 在 的 
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困 吗 ? 我 觉得 如 采 你 的 学 习 经 历 中 昕 过 一 些 优秀 老师 的 课 ， 你 束 不 会 
下 这 样 的 结论 。 好 的 老师 讲课 ， 是 可 以 做 到 引人入胜 的 。 


有 人 可 能 会 问 ， 我 为 什么 不 用 《大 话 设 计 模式 》 中 的 对 话 形式 ， 而 采 
用 讲 诬 形式 呢 ? 这 古 对 数据 结构 这 1] 学 问 的 特点 考虑 的 。 设 计 模 式 主 
要 都 是 思想 体现 ， 通 单 会 仁者 见 仁 、 智 着 见 智 ， 用 对 话 展开 比较 容 
易 ; 而 数据 结构 中 更 多 的 是 定义 、 术 语 、 经 典 算法 等 ， 这 些 公认 的 知 


识 ， 可 讨论 的 地 方 并 不 多 ， 更 多 的 是 需要 把 它 讲 清 楚 。 让 两 个 人 在 一 
起 讨论 某 个 设计 模式 的 优 缺 氮 ， 会 非常 合适 ， 而 讨论 数据 结构 定义 的 
好 坏 ， 就 没有 太 大 意义 了 ， 不 如 让 一 个 老师 告诉 学 生 数 据 结 构 的 定义 
好 在 哪里 更 符合 实际 。 因 此 用 传统 的 讲课 形式 会 好 一 些 。 


另外 ， 本 书 没有 习题 ， 有 思考 的 题目 也 一 定 会 给 出 某 种 答案 。 但 本 书 
每 个 复杂 知识 点 的 末尾 ， 都 会 提供 男 一 本 书 的 进一步 阅读 建议 。 这 也 
征 基 于 它 是 一 本 目 学 读物 的 原则 。 读 人 者 阅 读本 书 可 能 起 任何 时 间 任 何 
地 方 ， 如 采 书 中 存在 没有 解答 的 习题 ， 碰 到 了 困难 是 没 法 及 时 找到 老 
师 来 帮助 的 ， 因 此 本 书 尽 量 避 免 让 读者 有 这 样 的 困惑 存在 。 如果 需 要 
练习 的 同学 ， 我 觉得 还 是 应 该 考虑 再 去 飞 本 习题 集 来 和 学习。 学 习 数 据 
结构 和 算法 ， 做 题 和 上 机 写 代码 非常 有 必要 ， 从 这 个 角度 也 说 明 ， 阅 
读 完 本 书 其 实 也 只 是 完成 入 门 而 已 。 


本 书 既 然 是 以 老师 上 诬 的 形式 来 进行 ， 那 就 免不了 要 融入 一 名 教师 除 
了 授 业 解 惑 以 外 ， 还 要 传达 一 些 个 人 价值 观 的 体现 。 书 中 很 多 细微 
处 ， 如 对 某 位 科学 家 的 苯 敬 、 对 某 个 滤 法 的 推 案 、 对 勤奋 励志 故事 的 
讲述 等 都 在 表达 着 一 个 老师 向 学 生 传 递 真 、 善 、 美 的 意愿 。 我 始终 认 
为 ， 读 者 拿 到 的 虽然 只 是 一 本 没有 表情 、 不 会 说 话 的 书 ， 但 其 实 也 是 
在 隔 衬 与 刃 一 个 朋友 交流 。 人 与 人 的 交流 不 可 能 只 是 残 事 论 事 ， 一 定 
会 有 情感 的 沟通 ， 这 种 情感 如 果 能 产生 共鸣 、 达 成 互信 ， 束 会 让 事情 
(比如 学 习 数 据 结构 与 算法 这 件 事 ) 本 身 更 容易 理解 和 接受 。 


本 书 内 容 


本 书 主要 是 按照 教育 部 关于 计算 机 专业 数据 结构 课程 大 纲 的 要 求 略 微 
增 减 来 组 织 内 容 的 。 


主要 包括 : 数据 结构 介绍 ， 算 法 推导 大 0 阶 的 方法 ， 线 性 表 结 构 的 介 
绍 ， 顺 序 结构 与 链 式 结构 差异 ， 栈 与 队列 的 应 用 ， 串 的 朴素 模式 匹 

配 、KMP 模 式 匹配 算法 ， 树 结构 的 介绍 ， 二 又 树 前 中 后 序 遍 历 ， 线 索 
二 又 树 ， 替 夫 曼 树 及 应 用 ， 图 结构 的 介绍 ， 图 的 深度 、 广 度 遍 历 ， 最 
小 生成 树 两 种 算法 ， 最 短路 径 两 种 算法 ， 拓 扑 排序 与 关键 路 径 算法 ， 

查找 应 用 的 相关 介绍 ， 折 半 查 找 、 揪 值 查找 、 斐 波 那 契 查找 等 静态 查 
找 ， 稠 密 索 引 、 分 块 索引 、 倒 排 索引 等 索引 技术 ， 二 又 排序 树 、 平 稀 
二 又 树 等 动态 查找 ，B 树 、B+ 树 技术 ， 散 列表 技术 ， 排 序 应 用 的 相关 
介绍 ， 冒 泡 、 选 择 、 插 入 等 简单 排序 ， 希 尔 、 堆 、 归 并 、 快 速 等 改进 
排序 ， 各 位 排序 算法 的 对 比 等 。 


本 书 读者 


数据 结构 是 计 算 机 软件 相关 专业 的 基础 课程 ， 几 乎 可 以 说 ， 要 想 从 事 
编程 工作 ， 无 论 你 古 否 是 科班 出 身 ， 都 不 可 以 绕 过 这 部 分 知识 。 因 
此 ， 适 合 阅读 本 书 的 读者 非常 广泛 ， 包 括 在 读 的 本 专科 、 中 专职 高 技 
校 等 计算 机 专业 学 生 、 想 转行 做 开发 的 非 专 业 人 员 、 欲 考 计算 机 人 研究 
生 的 应 届 或 在 职 人 员 ， 以 及 工作 后 需要 补 学 或 温习 数据 结构 和 算法 的 
程序 员 等 各 类 读者 。 


本 书 对 读者 的 技术 背景 要 求 比较 低 ， 只 要 是 学 过 一 门 高 级 编程 语言 ， 
例如 C、C++、Java、C#、VB 等 就 可 以 开始 阅读 本 书 。 不 过 由 于 当中 涉 
及 到 比较 复杂 的 算法 知识 ， 需 要 读者 有 一 定 的 数学 修养 和 逻辑 思维 能 
力 ， 否 则 可 能 书籍 的 后 半 部 分 阅读 起 来 会 比较 吃力 。 


本 书 研读 方法 


事实 上 ， 任 何 有 难度 的 知识 和 技巧 ， 都 不 是 那么 容易 被 掌握 的 。 我 尽 
管 已 经 朝 着 通俗 易 懂 的 方向 努力 ， 可 有 些 数 据 结构 ， 特 别 是 经 典 算 
ο... ο J 


美国 畅销 书 《 如 何 阅读 一 本 书 》 中 提 到 “阅读 可 以 是 一 件 主动 的 事 ， 阅 
读 越 主动 ， 效 果 越 好 。 拿 同样 的 书 给 背景 相近 的 两 个 人 阅读 ， 一 个 人 
却 比 男 一 个 人 从 书 中 得 到 了 更 多 ， 这 是 因为 ， 首 先 在 于 这 人 的 主动 ， 

其 次 ， 在 于 他 在 阅读 中 的 每 一 种 活动 都 参与 了 更 多 的 技巧 。 这 两 件 事 
征 轧 县 相关 的 。 阅 读 生 一 个 复杂 的 活动 ， 束 跟 写 作 一 样 ， 包 含 了 大 量 
不 同 的 活动 。 要 达成 民 好 的 阅读 ， 这 些 活动 都 是 不 可 或 缺 的 。 一 个 人 
越 能 民 好 运作 这 些 活动 ， 阅 读 的 效 末 也 束 越 好 。” 


我 当然 布 望 读者 在 阅读 本 书后 收获 巨大 ， 但 这 显然 是 一 亲情 愿 。 要 想 
获得 更 多 ， 您 可 能 也 需要 付出 类 似 我 写作 一 样 的 力气 来 阅读 ， 例 如 摘 
抄 文字 、 眉 批 心 得 、 稿 纸 演算 、 代 码 输入 电脑 ， 以 及 您 自己 在 编程 工 
作 中 的 运用 等 。 这 些 相应 活动 的 执行 ， 将 会 使 您 得 到 巨大 的 收获 。 


作为 作者 ， 建 议 本 书 的 研读 方法 为 : 


。 复习 C 语 言 的 基础 知识 。 如 果 你 掌握 的 是 别 的 语言 也 不 有 要紧， 适当 
了 解 一 些 C 语 言 和 你 掌握 的 编程 语言 的 语法 差异 还 是 有 必要 的 。 甚 
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阅读 第 一 遇 时 ， 建 议 从 头 至 尾 进 行 。 如 果 你 对 前 面 的 知识 有 足够 
了 解 ， 当 然 可 以 跳 过 直接 阅读 后 面 的 章节 。 不 过 车 要 学 习 一 门 完 

整 的 知识 并 形成 体系 。 通 读本 书 ， 还 是 最 好 的 学 习 方 法 。 

阅读 时 ， 摘 抄 是 非常 好 的 习惯 。“ 最 淡 的 墨水 也 胜 于 最 强 的 记 

忆 ! ”有 不 少 读者 会 认为 摘抄 了 将 来 也 不 会 再 去 看 ， 有 什么 必要 ， 

但 其 实在 写字 的 过 程 就 是 大 脑 学 习 的 过 程 ， 写 字 在 减缓 你 阅读 的 
速度 ， 从 而 让 你 更 好 地 消化 阅读 的 内 容 。 相 信 大 家 都 能 理解 , “加 
IA RATS ea aR A ze Fe, AAS) Π|ΤΕ“ΠΙΗ͂, © 

阅读 每 一 章 时 ， 特 别 是 在 阅读 算法 的 推导 过 程 时 ， 一 定 要 在 电脑 
(本 书 源码 的 下 载 地 址 可 以 到 http://cj723.cnblogs.com 


《大 话 数据 结构 相关 主题 》 中 找到 ) ， 了 解 代码 的 运行 过 程 。 本 书 的 
很 多 算法 都 做 到 了 逐 行 讲解 ， 但 单纯 阅读 可 能 真 的 很 难 达到 理解 的 程 
Εξ (这 是 纸 质 书 无 法 克服 的 缺陷 ) ， 需 要 你 通过 开发 工具 调试 ， 并 设 
置 断 点 和 逐 行 执行 ， 并 参照 书 中 的 讲解 ， 观 察 变量 的 变化 情况 来 理解 
算法 的 编写 原理 。 


ο 阅读 完 每 一 章 时 ， 一 定 要 在 理解 基础 上 记忆 一 些 关 键 东 西 。 最 佳 
的 效果 就 是 你 可 以 不 看 书 也 做 到 一 点 不 错 地 默写 出 相关 算法 。 
阅读 完 每 一 革 时 ， 一 定 要 适当 练习 。 本 书 没有 提供 练习 题 ， 但 市 
场 上 相关 的 数据 结构 习题 集 比 比 则 是 ， 可 以 选择 受 试 。 另 外 互联 
网 上 也 可 以 获得 足够 的 习题 来 给 你 练习 。 练 习 的 目的 是 为 了 检测 
目 己 是 否 真 的 完全 理解 了 书 中 的 内 容 。 事 实 上 很 多 时 候 ， 阅 读 中 
的 人 们 只 是 目 我 感觉 理解 ， 而 并 非 真正 的 明白 。 

学 习 不 可 能 一 跷 而 束 ， 数 据 结构 和 算法 如 琳 通 过 一 本 书 就 可 以 午 
握 ， 那 本 身 就 古 笑 话 。 本 书 附录 提供 了 本 书写 作 时 的 参考 书目 ， 
基本 都 是 最 优秀 的 数据 结构 或 相关 的 中 文书 籍 各 有 侧重 ， 建 议 大 
家 可 以 适当 地 阅读 。 


例如 C90 标 准 的 注释 要 求 是 “/ TEREX SF 2? TAP EAE LS”: 要 
求 变 量 声 明 必 须要 在 函数 的 最 前 面 ， 只 能 是 “int 

ji;for(i=0;i<n;i++)...... ”， 而 不 允许 如 “for(int i=0;i<n;i++)” 这 样 的 方式 : 

再 比如 C++ 中 国 数 的 参数 可 以 传递 如 “void CreateBiTree(BiTree &T)” 的 
地 址 变量 ， 但 在 C 语 言 中 ， 只 能 传递 如 “void CreateBi-Tree(BiTree T)” #9 


ο ποτ ασ ως 


泽 


出 于 为 了 让 代码 可 以 在 低 端 编译 环境 通过 的 考虑 ， 牺 牲 一 些 代 码 的 简 
捷 性 和 优雅 性 也 是 无 可 奈何 和 必要 的 。 最 终 我 将 书 中 全 部 代码 都 改 成 
C90 标 准 的 代码 。 


C 语 言 初学 着 可 能 会 因为 刚 接 触 编程 语言 ， 特 别 是 对 指针 的 理解 不 深 ， 
而 担心 阅读 困难 。 我 个 人 感觉 ， 单 纯 学 习 指针 是 很 难 理解 它 的 真正 用 

途 和 好 人 处， 而 通过 学 习 数 据 结 构 ， 特 别 是 像 链 式 存储 结构 在 各 种 结构 
算法 中 的 运用 ， 反 而 可 以 让 读者 进一步 的 理解 指针 的 优越 之 处 。 从 这 

数据 结构 的 学 习 可 以 反 过 来 加 强 读者 对 C 语 言 ， 特 别 十 指针 
念 的 理解 。 


编程 语言 差异 
C 语 言 是 一 门 古 老 的 高 级 语言 ， 它 的 应 用 范围 非常 广泛 ， 因 此 我 选择 它 


作为 本 书 的 算法 展示 语言 。 如 果 读 者 之 前 学 过 它 ， 那 么 阅读 本 书 束 不 
仔 在 语言 障 得 。 民 得 C++ 语 言 的 读者 ， 同 样 也 个 会 有 任何 请 言 上 的 问 
jell ο 


掌握 Java、C#、VB 等 面向 对 象 语言 的 读者 ， 当 面 对 书 中 大 量 的 C 语 言 
式 的 结构 (struct) 声明 和 针对 结构 的 参数 传递 的 代码 时 ， 可 以 理解 为 
是 类 的 定义 和 由 类 生成 对 象 的 传递 。 尽 管 的 确 存在 差异 ， 但 并 不 影响 
整体 对 数据 结构 知识 和 算法 原理 的 理解 。 


我 个 人 感觉 ， 哪 怕 是 对 C 语 言 不 熟悉 ， 也 不 妨 利用 学 习 数据 结构 的 机 
会 ， 学 习 一 下 C 语 言 的 编程 方法 ， 这 对 于 将 来 应 用 其 他 高 级 语言 也 是 有 
很 大 帮助 的 。 


不 是 一 个 人 在 战斗 


首先 要 感谢 我 的 妻子 李 秀 廊 对 我 写作 本 书 期 间 的 全 力 文 持 ， 我 辞职 写 
作 ， 没 有 她 精神 上 的 理解 鼓励 和 生活 上 的 悉心 照顾 ， 是 不 可 能 走出 这 
一 步 并 顺利 完成 书稿 的 。 我 们 的 儿子 程 履 泗 如 今 已 经 三 周岁， 我 是 在 
他 每 日 的 欢声 笑语 和 器 器 啼 啼 中 进行 每 一 章节 的 构思 和 写作 ， 希 望 他 
可 以 苗 壮 成 长 。 我 的 父母 已 经 年 边 ， 他 们 为 我 的 全 职 创作 也 其 为 担心 
和 忧虑 ， 这 里 也 要 说 一 声 抱歉 。 


SEF, AISA abd T SARARIR Bae, AHS 
目 见 附录 。 没 有 前 幸 的 页 献 ， 就 没有 本 书 的 出 版 ， 也 希望 本 书 能 成 为 
这 些 书 籍 的 前 期 读物 。 在 此 向 这 些 图 书 作者 表示 训 心 的 感谢 。 


仅 有 作者 是 不 可 能 完成 图 书 的 出 版 的 ， 本 人 要 非常 感谢 清华 大 学 出 版 
社 的 朋友 们 ， 他 们 是 本 书 的 最 初 读者 ， 也 是 协助 本 人 将 此 书 由 毛 糙 变 
精良 的 最 有 力 帮手 。 本 书 的 封面 设计 程 瑜 、 插 图 设计 周 翔 ， 都 是 在 反 
反复 复 的 修改 中 完成 创作 的 。 写 作 中 还 得 到 了 周 适 、 卢 四 翔 、 张 侍 、 
胡 文 佳 、Milo、 陈 钢 、 刘 超 、 刘 唯一 、 杨 绣 国 、 威 寻 婷 、 雷 顺 、 杨 诗 
看 、 高 字 翔 、 林 健 的 友情 帮助 ， 他 们 都 在 本 人 的 创作 中 提出 了 宝贵 寻 
议 。 


在 此 癌 所 有 帮助 与 支持 我 的 朋友 道 一 声 : 谢谢 ! 
程 杰 


ΕΒΕ 


2007 年 ， 一 本 特 立 独行 的 IT 技术 图 书 《 大 话 设计 模式 》 横 空 出 世 ， 开 
创 了 一 种 者 派 技 术 图 书 风格 。 当 年 以 及 后 来 的 数 年 间 ， 横 扫 各 大 排 
行 ， 目 前 销售 已 经 超过 5 万 册 ， 几 乎 是 纯粹 的 店铺 销量 ， 在 最 近 10 年 的 
IT 图 书市 场 中 ， 这 是 个 了 不 起 的 数据 。 


作者 程 杰 并 没有 满足 这 个 成 绩 ， 耗 时 3 年 潜心 创作 了 另外 一 本 同样 是 程 
序 员 基 础 的 著作 一 一 《大 话 数 据 结构 》 。 


说 实话 ， 作 为 案 划 ， 我 并 没有 过 多 干预 作者 的 创作 过 程 ， 仪 仅 古 在 细 
世上 提出 我 的 一 些 看 法 。 我 的 工作 更 多 的 是 与 作者 来 回 推 殴 成 稿 后 的 
一 些 说 法 或 者 技术 点 上 的 问题 ， 男 外 还 反复 探讨 了 书 中 的 类 比 案例 的 
可 理解 性 。 最 终 细节 殴 定 还 是 在 上 海 一 家 咖啡 迄 里 完成 的 ， 我 和 作者 
在 那里 折腾 了 一 下 午 ， 终 于 达成 共识 。 


数据 结构 在 某 种 程度 上 和 设计 模式 类 似 ， 都 是 前 奉 的 武功 套路 。 不 同 
的 是 ， 设 计 模 式 是 近 几 十 年 的 卓越 程序 员 的 智慧 结晶 ， 而 数据 结构 征 
儿 特 上 干 年 的 无 数 科学 家 、 MERR RUNE, NR RAR 


AS 


大 家 知道 ， 程 序 是 利用 计算 机 高 速 运算 能 力 来 协助 我 们 处 理 一 些 需 
海量 运算 得 出 结果 的 问题 ， 应 用 程序 花哨 的 界面 和 有 效 的 用 户 体验 ， 
归根 到 瓜 都 需要 在 后 人 台 看 不 见 的 地 方 进行 运算 ， 得 出 我 们 需要 的 结 
一 一 无 论 是 在 气象 预报 还 是 “极品 飞车 ”。 


一 台 计 算 机 的 CPU 运算 能 力 是 固定 的 ， 只 会 机 械 地 接受 程序 的 指令 ， 

所 以 ， 算 法 的 优 劣 就 决定 了 程序 设计 水 平 的 高 低 。 举 个 简单 的 例子 ， 

数据 库 性 能 优化 这 个 工作 ， 收 费 是 按照 小 时 来 计算 的 ， 水 平 高 的 每 小 
时 可 以 达到 30 万 美金 ， 为 什么 会 值 这 么 多 钱 ? 有 价值 吗 ? 这 其 实 束 是 
算法 的 力量 ， 使 用 优秀 的 算法 可 以 为 大 型 企业 市 省 海量 的 硬件 投入 同 
时 带 来 巨大 的 效率 提升 一 一 比如 之 前 需要 100 台 小 型 机 ， 优 化 之 后 只 需 
ROS wis [; 之 前 查询 一 个 数据 需要 一 分 钟 出 来 结果 ， 优 化 之 后 1 秒 
钾 残 够 了 .……. 这 些 对 于 企业 来 说 ， 克 省 的 成 本 可 融 远 远 不 止 投入 的 几 
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国内 外 优秀 的 程序 员 很 多 毕业 于 数学 专业 ， 也 在 一 定 程 度 上 说 明了 这 
个 问题 。 国 内 的 程序 开发 现状 跟 国外 略 有 不 同 ， 大 家 都 在 关注 界面 和 
用 户 体 验 ， 在 算法 上 往往 要 求 不 高 。 这 其 实 是 国内 软件 行业 与 国外 软 
件 行业 的 最 大 差距 所 在 。 


我 们 的 程序 员 因 为 在 受 教育 的 过 程 中 (大 都 是 在 大 学 ) ， 由 于 种 种 原 
因 ， 数 据 结构 和 算法 的 基本 功 通常 要 差 一 些 ， 等 从 业 以 后 想 再 补课 又 
缺乏 好 的 教材 ， 或 者 说 适合 目 学 的 教材 。 数 据 结构 不 十 说 没有 优秀 教 
材 ， 比 如 《数据 结构 》《 算 法 导论 》 这 样 的 经 典 著 作 我 们 绝对 不 能 说 
不 好 ， 但 古 作为 目 学 ， 实 在 是 有 点 难 噶 。《 大 话 数 据 结构 》 延 续 了 作 
考 一 货 的 轻松 调侃 的 风格 ， 采 用 了 师 生 对 话 的 方式 ， 展 开 讨 论 ， 其 中 
穿插 了 大 量 “ 庸 俗 " 的 类 比 案例 ， 帮 助 大 家 迅速 < 开 穷 ”。 


在 我 的 一 篇 博文 (kobeluan.blog.51cto.com/237742/212175) 中 谈 到 国内 
原创 技术 书 整体 层次 偏 低 ， 不 是 因为 国内 没有 高 手 ， 最 关键 的 原因 有 
两 条 : 第 一 ， 国 内 版 税 太 低 ， 与 高 手 作 者 的 收入 差别 太 大 ， 导 致 很 多 
人 没有 时 间 和 心气 来 写 书 ; 第 二 ， 国 内 知识 产权 保护 不 力 ， 出 版 社 无 
法 用 提高 定价 的 方式 来 为 读者 和 作者 提供 更 好 的 服务 。 


类 似 程 术 这样 的 作者 ， 真 诚 地 将 自己 的 感悟 奉献 出 来 ， 与 作者 的 用 心 
相 比 ， 作 为 集 划 编辑 付出 的 劳动 束 不 值得 一 提 了 。 这 里 真心 布 望 读 少 
可 以 从 书 中 找到 需要 的 东西 ， 也 硕 望 国内 更 多 高 人 涌现 出 来 ， 为 大 家 
创作 更 适合 中 国人 阅读 的 优秀 技术 岁 书 。 清 华 大 学 出 版 社 ” 厅 大 成 局 
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第 1 章 数据 结构 绪论 


启示 

数据 结构 : 

是 相互 之 间 存 在 一 种 或 多 种 特定 关系 的 数据 元 聚 的 集合 。 
1.1 开场 白 


If you give someone a program, you willfrustrate them for a day; if you 
teach themhow to program, you will frustrate them fora lifetime. (如 果 你 交 
给 某 人 一 个 程序 ， 你 将 折磨 他 一 整 天 ;如果 你 教 某 人 如 何 编写 程序 ， 
你 将 折 麻 他 一 辈子 。) 


而 我 可 能 就 是 要 折磨 你 们 一 华 子 的 那个 人 。 大 家 好 ! 我 是 《数据 结 
构 》 这 门 课 的 老师 ， 我 叫 封 清 扬 。 同 学 私下 里 都 叫 我 < 病 子 ”， 嘿 喂 ， 
产子 可 是 有 思想 的 标志 哦 。 


在 座 的 大 家 给 我 面子 ， 都 来 选修 我 的 课 ， 这 点 我 很 高 兴 。 不 过 在 上 课 
前 ， 有 些 话 还 是 要 先 说 一 下 。 


数据 结构 是 计算 机 专业 的 基础 谍 程 ， 但 也 十 一 门 不 太 容 易学 好 的 谍 ， 
它 当 中 有 很 多 费 脑子 的 东西 ， 之 后 在 上 课时 ， 你 大 碰 到 了 困惑 或 不 解 
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常 ， 只 要 能 安全 到 达 就 是 成 功 。 


如 采 你 的 学 习 目 的 是 为 了 将 来 要 做 一 个 优秀 的 程序 员 ， 疝 微软 、 
Google 的 工程 师 们 看 齐 ， 那 么 你 应 该 要 努力 学 好 它 ， 不 单 是 来 听课 、 
看 看 教科 书 ， 还 需要 课 后 做 题 和 上 机 练习 。 不 过 话说 回来 ， 如 果 你 真 
有 这 样 的 志 癌 ， 诬 前 就 该 开始 研究 了 ， 这 样 来 听 我 的 课 ， 束 更 加 有 主 
BITE, WOR ΑΤΡ Α5 


如 琳 你 的 目的 是 为 了 考 计算 机 、 软 件 方面 的 研究 生 ， 那 么 这 | 1625 
课 ， 你 现在 束 可 以 准备 起 来 一 很 多 时 候 ， 考 人 研 玩 的 不 是 智 两， 其 
束 是 一 个 人 投入 的 时 间 而 已 。 


如 果 你 只 是 为 了 混 个 学 分 ， 那 么 你 至 少 应 该 要 坚持 来 上 课 ， 在 我 的 课 
堂上 听 僵 了 ， 学 明白 了 ， 考 前 适当 地 复习 ， 拿 下 这 几 个 学 分 应 该 个 在 
话 下 。 


如 琳 你 只 古来 打 次 油 的 ， 当 然 也 可 以 ， 我 的 课 不 妨碍 你 打 盗 油 ， 但 你 
也 不 要 妨碍 其 他 同学 坐 到 好 位 子 ， 所 以 请 靠 后 坐 ， 并 且 保 持 安 静 ， 静 
心 打 次 油 束 好 。 


如 果 ， 我 是 说 真 的 如 果 ， 你 是 一 个 对 编程 无 比 爱好 的 人 ， 你 学 数据 结 
构 的 目的 ， 既 不 是 为 了 工作 为 了 钱 ， 也 不 是 为 了 学 位 和 考试 ， 而 只 是 
为 了 更 好 地 去 感受 编程 之 美 。 啊 ， 你 应 该 得 到 我 的 欣赏 ， 我 想 我 非常 


实 


与 你 成 为 朋友 一 一 因为 我 目 己 也 没有 做 到 如 此 纯粹 地 去 学 习 和 应 
È o 


1.2 ”你 数据 结构 怎么 学 的 ? 


早先 我 有 一 个 学 生 叫 蔡 唉 ， 绰 号“ 小 菜 ”。 他 前 段 时 间 一 直通 过 E-mail 与 
ο ο ος 感慨 万 千 。 我 在 这 里 就 讲 讲 
ΣΕΠ. ο 


他 告诉 我 ， 在 做 我 学 生 时 ， 其 实 根 本 整 没 好 好 学 数据 结构 ， 时 第 逃 
课 ， 考 试 也 是 临时 突击 后 勉强 及 格 。 和 毕业 后 ， 他 几经 求职 ， 算 十 找到 
了 一 份 程序 员 的 工作 。 


工作 中 ， 有 一 次 他 们 需要 开发 一 个 客服 电话 系统 ， 他 们 项 目 经 理 安排 
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目 动 递增 的 整 型 数字 作为 客户 的 编号 。 只 要 来 一 个 客户 ， 融 给 这 张 表 
的 末尾 插入 一 条 数据 。 等 客服 系统 一 有 空间 ， 束 从 这 张 表 中 取出 最 小 
编号 的 客户 提交 ， 并 且 删 除 这 条 记录 。 伦 了 两 天 时 间 ， 他 完成 开发 并 
测试 通过 后 ， 得 意 地 提交 了 代码 。 谁 知 他 们 的 项 目 经 理 ， 看 完 代码 

后 ， 跑 到 他 的 桌 前 ， 拍 着 桌子 对 他 说 : “你 数据 结构 怎么 学 的 ? 这 种 实 


时 的 排队 模块 ， 用 什么 数据 库 呀 ， 在 内 存 中 完成 不 就 行 了 吗 。 赶 快 
改 ， 今 天 一 定 要 完成 ， 明 天 一 早 交 给 我 。* 


小 莱 吓 得 一 身 冷汗 ， 这 脸 丢 得 有 些 大 了 ， 自 己 试用 期 都 没 结束 ， 别 办 
此 失去 工作 。 于 是 他 当天 加 班 加 点 ， 忙 到 晚上 十 一 点 ， 用 数组 变量 重 
新 实现 了 这 个 功能 ， 因 为 考虑 到 怕 数 组 不 够 大 而 溢出 ， 于 是 他 设计 100 
作为 数组 的 长 度 。 


回 到 家 中 ， 他 害怕 这 个 代码 有 问题 ， 于 是 束 和 他 的 表 哥 大 乌 说 起 了 这 
个 事 。 他 表 哥 突 嘲 嘲 地 对 他 说 : “你 数据 结构 怎么 学 的 ? “DSR TROT HE 
张 着 大 口 ， 一 句 话 也 说 不 出 来 。 然 后 他 表 哥 告诉 他 ， 这 种 实时 的 排队 
系统 ， 通 常用 数据 结构 中 的 “队列 结构 ”是 比较 好 的 ， 用 数组 虽然 也 可 
以 ， 但 是 又 要 考虑 溢出 ， 又 要 考虑 新 增 和 删除 后 的 数据 移动 ， 总 的 说 
来 很 不 方便 。 你 只 要 这 样 .…... 这 样 …... 束 可 以 了 。 
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码 ， 上 班 时 用 U 盘 拷 回 公司 ， 终 于 算是 过 了 项 目 经 理 这 一 天 。 


之 后 ， 小 菜 开始 重视 数据 结构 ， 找 回 大 学 的 课本 重新 学 习 。 他 还 给 我 
发 了 好 些 邮 件 ， 问 了 我 不 少 他 困惑 的 数据 结构 和 算法 的 问题 ， 我 也 一 
一 给 了 他 解答 。 终 于 有 一 天 ， 他 学 完了 整个 课程 的 内 容 ， 并 给 我 写 了 
一 封 感谢 信 ， 信 中 是 这 么 说 的 : “ΠΕΙ. 您 好 ! 感谢 您 这 段 时 间 的 帮 
助 ， 在 大 学 时 没有 好 好 上 您 的 谍 真 是 我 最 大 的 遗憾 。 我 现在 已 经 学 完 
了 《数据 结构 》 人 整 本 书 的 内 容 ， 收 获 还 是 很 大 的 。 可 十 我 一 直 有 这 样 
的 困惑 想 请 教 您 ， 那 就 是 我 在 工作 中 发 现 ， 我 所 需要 的 如 栈 、 队 列 、 
链表 、 散 列表 等 结构 ， 以 及 查找 、 排 序 等 算法 ， 在 编程 语言 的 开发 工 
具 包 中 都 有 完 类 的 实现 ， 我 只 需要 掌握 如 何 使 用 它们 就 可 以 了 ， 为 什 
么 还 要 去 弄 懂 这 里 面 的 算法 原理 呢 ? ” 


我 收 到 这 封 信 时 ， 立 马 跳 了 起 来 ， 马 上 拨 通 了 他 的 手机 ， 第 一 句 话 就 
征 .…… 你 们 猜 猜 看 ， 我 说 了 啥 ?“ 你 数据 结构 怎么 学 的 ? ”( 全 场 同 学 
TF AI, KE) 

好 了 ， 我 为 什么 这 么 讲 ， 等 你 们 学 完 我 的 课程 束 目 然 会 明日 。 我 只 布 
望 在 将 来 ， 不 要 有 某 个 人 也 对 你 们 说 出 这 人 句 话 ， 如 果 当 真 听 到 了 这 人 句 
话 ， 束 拜托 你 不 要 说 你 的 数据 结构 老师 古 我 封 清 扬 ， 咖 咖 。 


现在 我 们 正式 开始 上 课 。 


1.5 ”数据 结构 起 源 


早期 人 们 都 把 计算 机 理解 为 数值 计算 工具 ， 束 中 感觉 计算 机 当然 生 用 
来 计算 的 ， 所 以 计算 机 解决 问题 ， 应 该 是 先 从 具体 问题 中 抽象 出 一 个 
适当 的 数据 模型 ， 设 计 出 一 个 解 此 数据 模型 的 算法 ， 然 后 再 编写 程 
序 ， 得 到 一 个 实际 的 软件 。 


可 现实 中 ， 我 们 更 多 的 不 是 解决 数值 计算 的 问题 ， 而 是 需要 一 些 更 科 
学 有 效 的 手段 (比如 表 、 树 和 图 等 数据 结构 ) 的 帮助 ， 才 能 更 好 地 处 
理 问 题 。 所 以 数据 结构 是 一 门 研究 非 数值 计算 的 程序 设计 问题 中 的 操 
作对 象 ， 以 及 它们 之 间 的 关系 和 操作 等 相关 问题 的 学 科 。 


1968 年 ， 美 国 的 高 德 纳 (Donald E. Knuth) 教授 在 其 所 写 的 《计算 机 程 
序 设计 艺术 》 第 一 卷 《 基 本 算法 》 中 ， 较 系统 地 阐述 了 数据 的 逻辑 结 
构 和 存储 结构 及 其 操作 ， 开 创 了 数据 结构 的 诬 程 体系 。 同 年 ， 数 据 结 
构 作为 一 门 独 立 的 课程 ， 在 计算 机 科学 的 学 位 课程 中 开始 出 现 。 也 就 
征 况 ， 那 之 后 计算 机 相关 专业 的 学 生 开始 接受 《数据 结构 》 的 “ 折 


磨 * 其 实 应 该 是 享受 才 对 。 


之 后 ，70 年 代 初 ， 出 现 了 大 型 程序 ， 软 件 也 开始 相对 独立 ， 结 构 程 序 
设计 成 为 程序 设计 方法 学 的 主要 内 容 ， 人 们 越 来 越 重视 “数据 结构 ”， 
认为 程序 设计 的 实质 是 对 确定 的 问题 选择 一 种 好 的 结构 ， 加 上 设计 一 
种 好 的 算法 。 可 见 ， 数 据 结 构 在 程序 设计 当中 占据 了 重要 的 地 位 。 程 
序 设计 = 数据 结构 + 算法 


1.4 基本 概念 和 术语 
说 到 数据 结构 是 什么 ， 我 们 得 先 来 谈 谈 什么 叫 数 据 。 


正 所 谓 “ 巧 妇 难 为 无 米 之 炊 ”"， 再 强大 的 计算 机 ， 也 是 要 有 “ 米 ” 下 钢 才 可 
以 干 活 的 ， 否 则 就 是 一 堆 破 铜 烂 铁 。 这 个 “ 米 ” 就 是 数据 。 


1.4.1 数据 


数据 : 是 描述 客观 事物 的 符号 ， 征 计算 机 中 可 以 操作 的 对 象 ， 是 能 被 
计算 机 识别 ， 并 输入 给 计算 机 处 理 的 符号 集合 。 数 据 不 仅仅 包括 整 
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比如 我 们 现在 常用 的 搜索 引擎 ， 一 般 会 有 网 页 、MP3、 图 片 、 视 频 等 
分 类 。MP3 束 是 声 首 数 据 ， 图 片 当然 是 图 像 数 据 ， 视 频 束 不 用 说 了 ， 
而 网 页 其 实 指 的 吏 是 全 部 数据 的 集合 ， 包 括 最 重要 的 数字 和 字符 等 文 
FOYE ° 
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。 可 以 输入 到 计算 机 中 。 

。 能 被 计算 机 程序 处 理 。 


对 于 整 型 、 实 型 等 数值 类 型 ， 可 以 进行 数值 计算 。 


对 于 字符 数据 类 型 ， 就 需要 进行 非 数 值 的 处 理 。 而 声音 、 图 像 、 视 频 
等 其 实 是 可 以 通过 编码 的 手段 变 成 字符 数据 来 处 理 的 。 


1.4.2 ”数据 元 素 


数据 元 素 : 是 组 成 数据 的 、 有 一 定 意 义 的 基本 单位 ， 在 计算 机 中 通常 
作为 整体 处 理 。 也 被 称 为 记录 。 


比如 ,在 人 类 中 ， 什 么 是 数据 元 素 呀 ?当然 是 人 了 。 
ERIE? 哈 ， 牛 、 马 、 羊 、 鸡 、 猪 、 狗 等 动物 当然 束 是 禽类 的 数据 元 


ΖΗ͂Ν 


1.4.3 ”数据 项 
数据 项 : 一 个 数据 元 素 可 以 由 若干 个 数据 项 组 成 。 


比如 人 人 这样 的 数据 元 素 ， 可 以 有 了 有 眼 、 耳 、 鼻 、 嘴 、 手 、 脚 这 些 数据 
项 ， 也 可 以 有 姓名 、 年 龄 、 性 别 、 出 生地 址 、 联 系 电话 等 数据 项 ， 具 
体 有 哪些 数据 项 ， 要 视 你 做 的 系统 来 决 是 。 


数据 项 是 数据 不 可 分 割 的 最 小 单位 。 在 数据 结构 这 门 课 程 中 ， 我 们 把 
数据 项 定义 为 最 小 单位 ， 是 有 助 于 我 们 更 好 地 解决 问题 。 所 以 ， 记 住 
了 ， 数 据 项 是 数据 的 最 小 单位 。 但 真正 讨论 问题 时 ， 数 据 元 素 才 是 奖 
据 结 构 中 建立 数据 模型 的 着 眼 点 。 殊 像 我 们 讨论 一 部 电影 时 ， 是 讨论 


这 部 电影 角色 这 样 的 “数据 元 素 "， 而 不 是 针对 这 个 角色 的 姓名 或 者 年 
龄 这 样 的 “数据 项 ”去 研究 分 析 。 


1.4.4 BTR 
数据 对 象 ， 是 性 质 相同 的 数据 元 素 的 集合 ， 是 数据 的 子 集 。 


什么 叫 性 质 相 同 呢 ， 有 是 指数 据 元 素 具 有 相同 数量 和 类 型 的 数据 项 ， 比 
如 ， 还 是 刚才 的 例子 ， 人 部 有 姓名 、 生 日 、 性 别 等 相同 的 数据 项 。 


既然 数据 对 象 是 数据 的 子 集 ， 在 实际 应 用 中 ， 处 理 的 数据 元 素 通 常 具 
ο κα 
好 了 ， 有 了 这 些 概念 的 铺垫 ， 我 们 的 主角 登场 了 。 

说 了 数据 的 定义 ， 那 么 数据 结构 中 的 结构 又 是 什么 呢 ? 

1.4.5 “数据 结构 

结构 ， 人 简单 的 理解 天 是 关系 ， 比 如 分 子 结构 ， 束 是 说 组 成 分 子 的 原子 
之 间 的 排列 方式 。 严 格 点 说 ， 结 构 是 指 各 个 组 成 部 分 相互 搭配 和 排列 
的 方式 。 在 现实 世界 中 ， 不 同 数据 元 素 之 间 不 是 独立 的 ， 而 是 存在 特 
定 的 关系 ， 我 们 将 这 些 关 系 称 为 结构 。 那 数据 结构 是 什么 ? 数据 结 
构 : 是 相互 之 间 存 在 一 种 或 多 种 特定 关系 的 数据 元 素 的 集合 。 

在 计算 机 中 ， 数 据 元 素 并 不 是 孤立 、 杂 乱 无 序 的 ， 而 是 具有 内 在 联系 
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为 编写 出 一 个 “好 ”的 程序 ， 必 须 分 析 待 处 理 对 象 的 特性 及 各 处 理 对 象 
之 间 存 在 的 关系 。 这 也 就 是 研究 数据 结构 的 意义 所 在 。 


定义 中 提 到 了 一 种 或 多 种 特定 关系 ， 具 体 十 什么 样 的 关系， 这 正 是 我 
们 下 面 要 讨论 的 问题 。 


15 ”逻辑 结构 与 物理 结构 
按照 视点 的 不 同 ， 我 们 把 数据 结构 分 为 逻辑 结构 和 物理 结构 。 


1.5.1 逻辑 结构 


逻辑 结构 : 是 指数 据 对 象 中 数据 元 素 之 间 的 相互 关系 。 其 实 这 也 是 我 

们 今后 最 需要 关注 的 问题 。 逻 辑 结构 分 为 以 下 四 种 : 

1. 集合 结构 

集合 结构 :集合 结构 中 的 数据 元 素 除 了 同属 于 一 个 集合 外 ， 它 们 之 间 

没有 其 他 关系 。 各 个 数据 元 素 是 “平等 的， 它们 的 共同 属性 是 “同属 于 

ΕΥ ο ος 
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线性 结构 : 线性 结构 中 的 数据 元 素 之 间 是 一 对 一 的 关系 (如 图 1-5-2 所 
不 ο 


N 


图 1-5-2 


3. 树 形 结构 


树 形 结构 : 树 形 结构 中 的 数据 元 素 之 间 存 在 一 种 一 对 多 的 层次 关系 
(如 图 1-5-3 所 示 ) ο 


图 1-5-3 
4. 图 形 结构 
图 形 结构 : 图 形 结构 的 数据 元 素 是 多 对 多 的 关系 (如 图 1-5-4 所 示 ) ° 


图 1-5-4 
我 们 在 用 示意 图 表示 数据 的 逻辑 结构 时 ， 要 注意 两 点 : 
。 将 每 一 个 数据 元 素 看 做 一 个 结 点 ， 用 圆圈 表示 。 


ο 元 素 之 间 的 逻辑 关系 用 绪 点 之 间 的 连 线 表 示 ， 如 宁 这 个 关系 是 有 
方向 的 ， 那 么 用 市 箭头 的 连 线 表示 。 
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据 元 素 之 间 的 逻辑 关系 。 


1.5.2 ”物理 结构 


说 完了 逻辑 结构 ， 我 们 再 来 说 说 数据 的 物理 结构 (很 多 书 中 也 叫做 存 
储 结构 ， 你 只 要 在 理解 上 把 它们 当 一 回 事 就 可 以 了 ) 。 


物理 结构 : 是 指数 据 的 逻辑 结构 在 计算 机 中 的 存储 形式 。 


数据 是 数据 元 隶 的 集合 ， 那 么 很 据 物理 结构 的 定义 ， 实 际 上 束 是 如 何 
把 数据 元 素 存储 到 计算 机 的 存储 器 中 。 存 储 禹 主要 是 针对 内 存 而 言 
的 ， 像 硬盘 、 软 盘 、 光 一 等 外 部 存储 咒 的 数据 组 织 通 稼 用 文件 结构 来 


描述 。 


数据 的 存储 结构 应 正确 反映 数据 元 际 之 间 的 逻辑 关系， 这 才 苹 最 为 天 
ο ο ο ο rnb nae 
难点 ο 


数据 元 素 的 存储 结构 形式 有 两 种 : 顺序 存储 和 链 式 存储 。 
1. 顺序 存储 结构 


顺序 存储 结构 : 是 把 数据 元 素 存 放 在 地 址 连续 的 存储 单元 里 ， 其 数据 
间 的 逻辑 关系 和 物理 关系 是 一 致 的 (如 图 1-5-5 所 示 ) 


00909000900 


图 1-5-5 


这 种 存储 结构 其 实 很 简单 ， 说 日 了 ， 束 是 排队 占 位 。 大 家 都 按 顺 序 排 
好 ， 每 个 人 占 一 小 段 空间 ， 大 家 谁 也 别 插 谁 的 队 。 我 们 之 前 学 计算 机 
语言 时 ， 数 组 束 是 这 样 的 顺序 存储 结构 。 当 你 告诉 计算 机 ， 你 要 建立 
一 个 有 9 个 整 型 数据 的 数组 时 ， 计 算 机 就 在 内 存 中 找 了 片 空 地 ， 按 照 一 


个 整 型 所 占 位 置 的 大 小 乘 以 9， 开 尽 一 段 连 续 的 空间 ， 于 是 第 一 个 数组 
数据 束 放 在 第 一 个 位 置 ， 第 二 个 数据 放 在 第 二 个 ， 这 样 依次 摆 放 。 


2. 链 式 存储 结构 


如 琳 束 是 这 么 简单 和 有 规律 ， 一 切 束 好 办 了 。 可 实际 上 ， 总 会 有 人 插 
队 ， 也 会 有 人 要 上 厕所 、 有 人 会 放弃 排队 。 所 以 这 个 队伍 当中 会 添加 
新 成 员 ， 也 有 可 能 会 去 挥 老 元 素 ， 整 个 结构 时 刻 都 处 于 变化 中 。 显 
然 ， 面 对 这 样 时 常 要 变化 的 结构 ， 顺 序 存 储 是 不 科学 的 。 那 把 么 办 
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爱 在 哪 在 哪 ， 可 以 坐 着 、 站 着 或 者 走动 ， 甚 至 出 去 选 一 图 ， 只 要 及 时 
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链 式 存储 结构 : 是 把 数据 元 素 存放 在 任意 的 存储 单元 里 ， 这 组 存储 单 
元 可 以 是 连续 的 ， 也 可 以 是 不 连续 的 。 数 据 元 素 的 存储 关系 并 不 能 反 
映 其 逻辑 关系 ， 因 此 需要 用 一 个 指针 存放 数据 元 素 的 地 址 ， 这 样 通过 
地 址 就 可 以 找到 相关 联 数 据 元 素 的 位 置 (如 图 1-5-6 所 示 ) ° 


图 1-5-6 


显然 ， 链 式 存 储 吏 灵活 多 了 ， 数 据 存在 哪里 不 重要 ， 只 要 有 一 个 指针 
存放 了 相应 的 地 址 就 能 找到 它 了 。 


前 儿 年 香港 有 部 电影 叫 《无 间 道 》， 大 陆 还 有 部 电视 剧 叫 《潜伏 》，， 

都 很 火 ， 不 知道 大 家 有 没有 看 过 。 大 致 说 的 是 ， 肝 一 方 洲 伏 在 敌人 的 
内 部 ， 进 行 一 些 情报 收集 工作 。 为 了 不 暴露 每 个 潜伏 人 员 的 真实 号 

份 ， 往 往 都 是 单线 联系 ， 只 有 上 线 知道 下 线 征 谁 ， 并 且 走 通过 暗号 来 
联络 。 正 闻 情 况 下 ， 情 报 和 可 以 顺利 地 上 传 下 达 的 ， 但 是 如 采 茶 个 链 
条 中 结 点 的 同志 牺牲 了 ， 那 束 磋 烦 了 ， 因 为 其 他 人 不 知道 上 线 或 者 下 
线 是 谁 ， 后 果 束 很 严重 。 比 如 在 《无 间 道 》 中 ， 梁 朝 伟 旦 警方 在 黑 社 
会 中 的 卧 确 ， 一 直 是 与 黄秋生 扮演 的 警官 联络 ， 可 当 黄 过 害 后 ， 染 允 
无 法 证 明 上 自 己 是 一 个 警察 。 所 以 影片 的 结尾 ， 当 梁朝伟 用 枪 指 着 刘 德 
华 的 尖 说 , “对 不 起 ， 我 是 均 察 。” 刘 德 华 马 上 反问 道 :“ 谁 知道 呢 ? "是 
呀 ， 当 没有 人 可 以 证 明 你 身份 的 时 候 ， 谁 知道 你 是 谁 呢 ? 影片 看 到 这 
里 ， 多 少 让 人 有 些 鸣 咕 感慨。 这 其 实 束 是 链 式 关系 的 一 个 现实 样 例 。 


逻辑 结构 是 面 同 问 题 的 ， 而 物理 结构 就 古 面 同 计算 机 的 ， 其 基本 的 目 
标 束 是 将 数据 及 其 逻辑 关系 存 储 到 计算 机 的 内 存 中 。 


1.6 ”抽象 数据 类 型 
1.6.1 ”数据 类 型 
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当年 那些 设计 计算 机 语言 的 人 ， 为 什么 会 考虑 到 数据 类 型 呢 ? 


比如 ， 大 家 都 需要 住房 子 ， 也 都 希望 房子 越 大 越 好 。 但 显然 ， 没 有 
钱 ， 考 虑 房子 是 没 喻 意义 的 。 于 十 商品 房 就 出 现 了 各 种 各 样 的 房型 ， 
有 别墅 的 ， 有 错 层 的 ， 有 单间 的 ;有 一 百 多 平米 的 ， 也 有 儿 十 平 炒 
的 ， 甚 至 在 北京 还 出 现 了 胶 吉 公寓 一 只 有 两 平米 的 房间 .…… 这 样 束 
满足 了 不 同人 的 需要 。 


同样 ， 在 计算 机 中 ， 内 存 也 不 是 无 限 大 的 ， 你 要 计算 一 个 如 1+1=2、 
3+5=8 这 样 的 整 型 数字 的 加 减 乘除 运算 ， 显 然 不 需要 开辟 很 大 的 适合 小 


数 甚至 字符 运算 的 内 存 空间 。 于 是 计算 机 的 研究 者 们 就 考虑 ， 要 对 数 
据 进行 分 类， 分 出 来 多 种 数据 类 型 。 


在 C 语 言 中 ， 按 照 取 值 的 不 同 ， 数 据 类 型 可 以 分 为 两 类 : 
原子 类 型 : 是 不 可 以 再 分 解 的 基本 类 型 ， 包 括 整 型 、 实 型 、 子 符 


型 等 。 
结构 类 型 ， 由 若干 个 类 型 组 合 而 成 ， 是 可 以 再 分 解 的 。 例 如 ， 整 
型 数组 是 由 若干 整 型 数据 组 成 的 。 


比如 ， 在 C 语 言 中 变量 声明 int ab， 这 就 意味 着 ， 在 给 变量 a 和 b 赋 值 时 
不 能 超出 int 的 取 值 范围 ， 变 量 a 和 b 之 间 的 运算 只 能 是 int 类 型 所 允许 的 
运算 。 


因为 不 同 的 计算 机 有 不 同 的 硬件 系统 ， 这 就 要 求 程序 语言 最 终 通 过 编 
译 郁 或 解释 需 转 换 成 展 层 语言 ， 如 汇编 语言 甚至 是 通过 机 大 语 言 的 数 
据 类 型 来 实现 的 。 可 事实 上 ， 高 级 语言 的 编程 者 不 管 最 终 程序 运行 在 
什么 计算 机 上 ， 他 的 目的 整 是 为 了 实现 两 个 整 型 数 子 的 运算 ， 如 a+b、 
a-b、axb 和 a/b 等 ， 他 才 不 关心 整数 在 计算 机 内 部 是 如 何 表示 的 ， 也 不 
想 知 道 CPU 为 了 实现 1+2 进 行 几 次 开关 操作 ， 这 些 操 作 是 如 何 实现 的 ， 
对 高 级 语言 开发 者 来 讲 根本 不 重要 。 于 是 我 们 束 会 考虑 ， 无 论 什么 计 
算 机 、 什 么 计算 机 语言 ， 大 都 会 面临 看 如 整数 运算 、 实 数 运算 、 字 符 
运算 等 操作 ， 我 们 可 以 考虑 把 它们 都 抽象 出 来 。 

抽象 是 指 抽 取出 事物 具有 的 普遍 性 的 本 质 。 它 是 抽出 问题 的 特征 而 名 


格 非 本 质 的 细 下 ， 有 是 对 具体 事物 的 一 个 概括 。 抽 象 是 一 种 思考 问题 的 
方式 ， 它 隐藏 了 党 杂 的 细 世 ， 只 保留 实现 目标 所 必需 的 信息 。 


1.6.2 ”抽象 数据 类 型 

我 们 对 已 有 的 数据 类 型 进行 抽象 ， 就 有 了 抽象 数据 类 型 。 

抽象 数据 类 型 (Abstract Data Type, ADT) : 是 指 一 个 数学 模型 及 定义 
在 该 模型 上 的 一 组 操作 。 抽 象 数 据 类 型 的 定义 仅 取 决 于 它 的 一 组 逻辑 
特性 ， 而 与 其 在 计算 机 内 部 如 何 表 示 和 实现 无 关 。 

比如 刚才 的 例子 ， 各 个 计算 机 ， 不管 是 大 型 机 、 小 型 机 、PC、 平 板 电 


脑 、PDA， 其 至 智能 手机 都 拥有 “整数 ”类 型 ， 也 需要 整数 间 的 运算 ， 
那么 整 型 其 实 束 是 一 个 抽象 数据 类 型 ， 尽 管 它 在 上 面 提 到 的 这 些 在 不 


同 计算 机 中 实现 方法 上 可 能 不 一 样 ， 但 由 于 其 定义 的 数学 特性 相同 ， 
在 计算 机 编程 者 看 来 ， 它 们 都 是 相同 的 。 因 此 ,， “抽象” 的 意义 在 于 数 
据 类 型 的 数学 抽象 特性 。 


而 且 ， 抽 象 数据 类 型 不 仅仅 指 那些 已 经 定义 并 实现 的 数据 类 型 ， 还 可 
以 是 计算 机 编程 者 在 设计 软件 程序 时 自己 定义 的 数据 类 型 ， 比 如 我 们 
编写 天 于 计算 机 绘图 或 者 地 图 类 的 软件 系统 ， 经 贡 都 会 用 到 坐标 。 也 
束 是 说 ， 总 是 有 成 对 出 现 的 x 和 y， 在 3D 系 统 中 还 有 z 出 现 ， 既 然 这 三 个 
整 型 数字 是 始终 在 一 起 出 现 ， 我 们 就 定义 一 个 叫 point 的 抽象 数据 类 
型 ， 它 有 x、y、z 三 个 整 型 变量 ， 这 样 我 们 很 方便 地 操作 一 个 point 数 据 
变量 下 能 知道 这 一 点 的 坐标 了 。 


根据 抽象 数据 类 型 的 定义 ， 它 还 包括 定义 在 该 模型 上 的 一 组 操作 。 束 
像 “ 超 级 玛丽 ”这 个 经 典 的 任 天 特 游戏 ， 里 面 的 游戏 主角 是 马里 奥 
(Mario) 。 我 们 给 他 定义 了 几 种 基本 操作 ， 走 (前 进 、 后 退 、 上 、 
下 ) 、 跳 、 打 子弹 等 。 一 个 抽象 数据 类 型 定义 了 : 一 个 数据 对 象 、 数 
据 对 象 中 各 数据 元 素 之 间 的 关系 及 对 数据 元 素 的 操作 。 至 于 ， 一 个 抽 
象 数据 类 型 到 拭 需 要 哪些 操作 ， 这 就 只 能 由 设计 者 根据 实际 需要 来 
定 。 像 马里 奥 ， 可 能 开始 只 有 两 种 操作 ， 走 和 跳 ， 后 来 发 现 应 该 要 增 
加 一 种 打 子 弹 的 操作 ， 再 后 来 发 现 有 些 玩 家 希望 它 可 以 走 得 快 一 点 ， 
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图 1-6-1 


事实 上 ， 抽 象 数据 类 型 体现 了 程序 设计 中 问题 分 解 、 抽 象 和 信息 隐藏 
的 特性 。 抽 象 数据 类 型 把 实际 生活 中 的 问题 分 解 为 多 个 规模 小 且 容 易 
处 理 的 问题 ， 然 后 建立 一 个 计算 机 能 处 理 的 数据 模型 ， 并 把 每 个 功能 
κ λα E 


为 了 便于 在 之 后 的 讲解 中 对 抽象 数据 类 型 进行 规范 的 描述 ， 我 们 给 出 
了 描述 抽象 数据 类 型 的 标准 格式 : 


象 数据 类 型 名 


Data 


数据 元 素 之 间 逻 辑 关 系 的 定义 


Operation 
操作 1 
初始 条 件 
操作 结果 描述 


操作 2 


endADT 


17 ”总结 回顾 


今天 首先 用 我 一 个 不 争气 的 学 生 为 例子 ， 说 明 数 据 结构 很 重要 。 接 着 
讲 了 数据 结构 的 起 产 ， 说 白 了 ， 束 是 一 老外 ， 觉 得 编程 这 玩意 儿 不 弄 
得 复 洒 点 ， 不 能 证 明 他 厉害 ， 所 以 推出 “数据 结构 ”这 一 谍 程 ， 让 所 有 
学 编程 的 人 “至 受 它 带 来 的 乐趣 ”或 者 “体验 被 折磨 后 无 尽 的 烦恼 ”。 


接着 ， 正 式 介绍 了 数据 结构 的 一 些 相关 概念 ， 如 图 1-7-1 所 示 。 
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1-7-1 


由 这 些 概念 ， 给 出 了 数据 结构 有 定义 ; 数据 结构 是 相互 之 间 存 在 一 种 
ο το. 。 同 样 是 结构 ， 从 不 同 的 角度 来 讨 
会 有 不 同 的 分 类 ， 如 图 1-7- oR 


物理 结构 
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图 1-7-2 
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最 后 ， 我 想 对 那些 已 经 开始 目 学 数据 结构 的 同学 说 ， 可 能 你 们 会 困 

惑 、 不 懂 、 不 理解 、 不 会 应 用 ， 甚 至 不 知 所 云 。 可 实际 上 ， 无 论 学 什 
么 ， 都 是 要 努力 才 可 以 学 到 真 东 西 。 只 有 真正 掌握 技术 的 人 ， 才 有 可 
能 去 享用 它 。 如 果 你 中 途 放 弃 了 ， 之 前 所 有 的 努力 和 付出 都 会 变 得 没 
有 价值 。 学 会 游泳 难 吗 ? 掌握 英语 口语 难 吗 ? 可 能 是 难 ， 但 在 掌握 了 
的 人 上 腿 里 ， 这 根本 不 算 什么 , “ 束 那 么 回 事 呀 ”。 只 要 你 相信 和 目 己 一 定 
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第 2 章 算法 
启示 
算法 : 


算法 旦 解决 特定 问题 求解 步 又 的 朱 述 ， 在 计算 机 中 表现 为 指令 的 有 限 
序列 ， 并 且 每 条 指令 表示 一 个 或 多 个 操作 。 


21 开场 白 
各 位 同学 大 家 好 。 


上 次 上 完 课 后 ， 有 同学 对 我 说 ， 老 师 ， 我 听 了 你 的 课 ， 感 觉 数 据 结构 
没什么 的 ， 你 也 太 夺 大 它 的 难度 了 。 

征 呀 ， 我 好 像 是 强调 了 数据 结构 比较 搞 脑 子 ， 而 上 次 课 ， 其 实 还 没 合 
出 复杂 的 东西 来 说 道 。 不 羡 不 想 ， 和 是 没 必 要 ， 第 一 次 课 殉 把 你 们 糊弄 
学， 那 以 后 还 玩 什 么 ， 逃 课 的 不 束 更 多 了 吗 ? 你 们 看 ， 今 天 来 的 人 数 
和 第 一 次 过 不 多 ， 而 且 和 暂时 还 没有 睡觉 的 。 


今天 我 们 介绍 的 内 容 在 难度 上 就 有 所 增加 了 ， 做 好 准备 了 吗 ? 
2.2 ”数据 结构 与 算法 关系 


我 们 这 门 课程 叫 数据 结构 ， 但 很 多 时 候 我 们 会 讲 到 算法 ， 以 及 它们 之 
间 的 关系 。 市 场 上 也 有 不 少 书 叫 “ 数 据 结构 与 算法 分 析 ” 这 样 的 名 字 。 


有 人 可 能 就 要 问 了 ， 那 你 到 底 是 只 讲 数据 结构 呢 ， 还 是 和 算法 一 起 
W? 它们 之 间 是 什么 天 系 呢 ? 干吗 要 放 在 一 起 ? 


这 问题 坚 么 回答 。 打 个 比方 吧 , 今天 是 你 女友 生日 ， 你 打算 请 女友 去 
看 爱情 音乐 剧 ， 到 了 戏院 ， 抬 头 一 看 《梁山 伯 》18: 00 开 演 9 
A, BARER? 一 问 才 知 ， 今 天 饰演 祝 英 台 的 演员 生病 ， 所 以 染 
山 伯 唱 独 角 戏 。 真 是 搞笑 了 ， 这 还 有 什么 看 头 。 于 走 你 们 打算 去 看 爱 
情 电影 。 到 了 电影 院 ， 一 看 海报 一 一 《罗密欧 》， 古 不 是 名 字 写 错 
了 ， 问 了 才 知 ， 原 来 饰演 朱丽叶 的 演员 因为 嫌弃 演出 费用 太 低 ， 中 途 
退 演 了 。 制 片 方 考虑 到 已 经 开拍 ， 于 是 束 把 电影 名 字 定 为 《 罗 密 
欧 》， 主 要 讲 男 主角 的 心路 旅程 。 哎 ， 这 电影 还 怎么 看 啊 ? 


事实 上 ， 数 据 结 构 和 算法 也 十 类 似 的 关系。 只 谈 数 据 结构 ， 当 然 古 可 
以 ， 我 们 可 以 在 很 短 的 时 间 束 把 几 种 重要 的 数据 结构 介绍 完 。 听 完 

后 ， 很 可 能 你 没什么 感觉 ， 不 知道 这 些 数 据 结构 有 何 用 处 。 但 如 果 我 
们 再 把 相应 的 算法 也 拿 来 讲 一 讲 ， 你 就 会 发 现 ， 甚 至 开始 感慨 : R, 

计算 机 界 的 前 幸 们 ， 的 确 是 一 些 很 牛 很 牛 的 人 ， 他 们 使 得 很 多 看 似 很 
难 解决 或 者 没 法 解决 的 问题 ， 变 得 如 此 美妙 和 神奇 。 


也 许 从 这 以 后 ， 慢 慢 地 你 们 中 的 一 些 人 会 开始 把 你 们 的 崇拜 对 象 ， 从 
帅哥 美女 、 什 么 “可 ”什么 “ 姐 ” 们 ， 转 移 到 这 些 大 胡子 或 者 秃顶 的 老头 身 
上 ， 那 我 束 非 常 欣 转 了 。 而 且 ， 这 显然 是 一 种 成 熟 的 表现 ， 我 期 待 你 
们 中 多 一 点 这 样 的 人 ， 这 样 我 们 国家 的 软件 行业 ， 也 许 束 有 得 救 了 。 


不 过 话说 回来 ， 现 在 好 多 大 学 里 ， 通 单 都 是 把 “算法 ?分 出 一 门 读 单 独 
讲 的 ， 也 就 是 说 ， 在 《数据 结构 》 课 程 中 ， 就 算 谈 到 算法 ， 也 是 为 了 
帮助 理解 好 数据 结构 ， 并 不 会 详细 谈 及 算法 的 方方面面 。 我 们 的 课程 
也 是 按 这 样 的 原则 来 展开 的 。 


2.3 ”两 种 算法 的 比较 
大 家 部 已 经 学 过 一 | 计算 机 语言 ， 不 管 学 的 是 哪 一 种 ， 学 得 好 不 好 ， 


好 区 是 可 以 写 点 小 程序 了 。 现 在 我 要 求 你 写 一 个 求 1+2+3+..…..+100 结 果 
的 程序 ， 你 应 该 怎么 写 呢 ? 


大 多 数 人 会 马上 写 出 下 面 的 C 语 言 代 码 (或 者 其 他 语言 的 代码 ) : 


Thies súm = 0 ne 1008 
πο ος ΕΙ a S tet) 
£ 


sum = sum + i; 


} 


printf("%d", sum); 


Demi TRAE Z —, ERE ΜΙΑ, RARER IS 
的 含义 了 。 问 题 在 于 ， 你 的 第 一 直觉 古 这 样 写 的 ， 但 这 样 古 不 是 真 的 
很 好 ? 是 不 是 最 高 效 ? 


此 时 ， 我 不 得 不 把 伟大 数学 家 高 斯 的 童年 故事 拿 来 说 一 志 ， 也 许 你 们 
人 


据说 18 世 纪 生 于 德国 小 村 庄 的 高 斯 ， 上 小 学 的 一 天 ， 课 堂 很 乱 ， 就 像 
我 们 现在 下 面 那些 窃窃 私语 或 者 拿 着 手机 不 停摆 弄 的 同学 一 样 ， 老 师 
非常 生气 ， 后 果 自 然 也 很 严重 。 于 是 老师 在 放学 时 ， 就 要 求 每 个 学 生 
都 计算 1+2+...+100 的 结果 ， 谁 先 算出 来 谁 先 回 家 ο 


天 才 当 然 不 会 被 这 样 的 问题 难 倒 ， 高 斯 很 快 就 得 出 了 答案， 是 5050 。 

老师 非常 惊讶 ， 因 为 他 上 自己 想必 也 是 通过 1+2=3，3+3=6， 

6+4=10，......，4950+100=5050 这 样 算出 来 的 ， 也 算 了 很 久 很 信 。 说 不 

ο ο ο eee 
HR? 


高 斯 解释 道 : 


sum= 1+ 2+ 3+.. + 99+ 100 
sum = 100+ 99+ 98+.. + 2+ 1 
2xsum= 101+101+101+.. + 101+ 101 


\ 一 


共 100 个 
所 以 Sum=5050 
用 程序 来 实现 如 下 : 


ime súm = 0n 190. 
Un S ai Πρ 


printf("%d", sum); 


神童 束 是 神童 ， 他 用 的 方法 相当 于 另 一 种 求 等 老 数 列 的 算法 ， 不 仅仅 
可 以 用 于 1 加 到 100， 就 是 加 到 一 千 、 一 万 、 一 亿 (需要 更 改 整 型 变量 
类 型 为 长 整 型 ， 否 则 会 溢出 ) ， 也 就 是 瞬间 之 事 。 但 如 果 用 刚才 的 程 
序 ， 显 然 计算 机 要 循环 一 千 、 一 万 、 一 亿 次 的 加 法 和 运算。 人 脑 比 电脑 
算得 快 ， 似 乎 成 为 了 现实 。 


2.4 算法 定义 
什么 是 算法 呢 ? 算 法 是 描述 解决 问题 的 方法 。 算 法 (Algorithm) 这 个 


单词 最 早出 现在 波斯 数学 家 阿 勒 伦 刺 子 密 在 公元 825 年 《相当 于 我 们 中 
国 的 唐朝时 期 ) 所 写 的 《印度 数字 算术 》 中 。 如 今 普遍 认可 的 对 算法 


的 定义 是 : RA ERR cE ALKA RAL, TEV RL PRY 
指令 的 有 限 序列 ， 并 且 每 条 指令 表示 一 个 或 多 个 操作 。 


κ. 对 于 给 定 的 问题 ， 是 可 以 有 多 种 算法 来 解决 


那 我 惑 要 问 问 你 们 ， 有 没有 通用 的 算法 呀 ? 这 个 问题 其 实 很 弱智 ， 融 
像 问 有 没有 可 以 包 治 百 病 的 药 呀 ! 


现实 世界 中 的 问题 千奇百怪 ， 算 法 当然 也 束 干 变 万 化 ， 没 有 通用 的 算 
法 可 以 解决 所 有 的 问题 。 甚 至 解决 一 个 小 问题 ， 很 优秀 的 算法 却 不 一 


EERE ° 


算法 定义 中 ， 提 到 了 指令 ， 指 令 能 被 人 或 机 天 等 计算 痛 置 执行 。 它 可 
以 是 计算 机 指令 ， 也 可 以 是 我 们 平时 的 语言 文子 。 


为 了 解决 某 个 或 某 类 问题 ， 需 要 把 指令 表示 成 一 定 的 操作 序列 ， 操 作 
序列 包括 一 组 操作 ， 每 一 个 操作 都 完成 特定 的 功能 ， 这 就 是 算法 了 。 


2.5 ”算法 的 特性 
算法 具有 五 个 基本 特性 : 输入 、 输 出 、 有 穷 性 、 确 定性 和 可 行 性 。 
2.5.1 输入 输出 


输入 和 输出 特性 比较 容易 理解 ， 算 法 具有 零 个 或 多 个 输入 。 尽 管 对 于 
绝 大 多 数 算法 来 说 ， 输 入 参数 都 是 必要 的 ， 但 对 于 个 别 情况 ， 如 打 

印 “helloworld! ”这 样 的 代码 ， 不 需要 任何 输入 参数 ， 因 此 算法 的 输入 
可 以 是 零 个 。 算 法 至 少 有 一 个 或 多 个 输出 ， 算 法 是 一 定 需要 输出 的 ， 

不 需要 和 输出， 你 用 这 个 算法 干吗 ? 输出 的 形式 可 以 是 打印 输出 ， 也 可 
以 是 返回 一 个 或 多 个 值 等 。 

2.5.2 AFE 

AVE: 指 算法 在 执行 有 限 的 步骤 之 后 ， 自 动 结束 而 不 会 出 现 无 限 循 
环 ， 并 且 每 一 个 步骤 在 可 接受 的 时 间 内 完成 。 现 实 中 经 常会 写 出 死 循 


环 的 代码 ， 这 就 是 不 满足 有 穷 性 。 当然 这 里 有 穷 的 概念 并 不 是 纯 数 学 
意义 的 ， 而 是 在 实际 应 用 当中 合理 的 、 可 以 接受 的 * 有 边界 ”。 你 说 你 


写 一 个 算法 ， 计 算 机 需要 算 上 个 二 十 年 ， 一 定 会 结束 ， 它 在 数学 意义 
上 是 有 穷 了 ， 可 是 媳妇 都 熬 成 清 了 ， 算 法 的 意义 也 不 就 大 了 。 


2.5.3 ”确定 性 


确定 性 : 算法 的 每 一 步骤 都 具有 确定 的 含义 ， 不 会 出 现 二 义 性 。 算 法 
在 一 定 条 件 下 ， 只 有 一 条 执行 路 径 ， 相 同 的 输入 只 能 有 唯一 的 输出 结 
东 。 算 法 的 每 个 步 又 被 精确 定义 而 无 收 义 。 


2.5.4 可行 性 


可 行 性 : 算法 的 每 一 步 都 必须 是 可 行 的 ， 也 融 是 说 ， 每 一 步 都 能 够 通 
过 执行 有 限 次 数 完成 可行 性 意味 着 算法 可 以 转换 为 程序 上 机 运行 ， 
并 得 到 正确 的 结 末 。 尽 管 在 目前 计算 机 界 也 存在 那 种 没有 实现 的 极为 
复杂 的 算法 ， 不 是 说 理论 上 不 能 实现 ， 而 是 因为 过 于 复杂 ， 我 们 当前 
的 编程 方法 、 工 具 和 大 脑 限 制 了 这 个 工作 ， 不 过 这 都 是 理论 研究 领域 
的 问题 ， 不 属于 我 们 现在 要 考虑 的 范围 。 


26 ”算法 设计 的 要 求 


刚才 我 们 谈 到 了 ， 算 法 不 是 唯一 的 。 也 束 是 说 ， 同 一 个 问题 ， 可 以 有 
多 种 解决 问题 的 算法 。 这 可 能 让 那些 单 年 只 做 有 标准 答案 题目 的 同学 
失望 了 ， 他 们 多 人 么 布 望 存在 标准 答案 ， 只 有 一 个 是 正确 的 ， 把 它 将 下 
来 ， 需 要 的 时 候 套用 就 可 以 了 。 不 过 话说 回来 ， 尽 管 算法 不 唯一 ， 相 
对 好 的 算法 还 是 存在 的 。 擎 握 好 的 算法 ， 对 我 们 解决 问题 很 有 大助， 
否则 前 人 的 智慧 我 们 不 能 利用 ， 束 都 得 目 己 从 头 研究 了 。 那 么 什么 才 
叫好 的 算法 呢 ? 


咖 ， 没 篆 ， 有 同学 说 ， 好 的 算法 ， 起 码 要 走 正 确 的 ， 连 正确 都 谈 不 
上 ， 还 谈 什 么 别 的 要 求 ? 


2.6.1 正确 性 


正确 性 : 算法 的 正确 性 是 指 算法 至 少 应 该 具有 输入 、 输 出 和 加 工 处 理 
无 玻 义 性 、 能 正确 反映 问题 的 需求 、 能 够 得 到 问题 的 正确 答案 。 


但 古 算法 的 “正确 ”通常 在 用 法 上 有 很 大 的 差别 ， 大 体 分 为 以 下 四 个 层 
次 。1. 算 法 程序 没有 语法 错误 。 2. 算 法 程序 对 于 合法 的 输入 数据 能 够 
产生 满足 要 求 的 输出 结果 。 3. 算 法 程序 对 于 非法 的 输入 数据 能 够 得 出 


满足 规格 说 明 的 结果 。 4. 算 法 程序 对 于 精心 选择 的 ， 甚 至 刁难 的 测试 
数据 部 有 满足 要 求 的 输出 结 琳 。 


对 于 这 四 层 舍 义 ， 层 次 1 和 要 求 最 低 ， 但 是 仅仅 没有 语法 销 误 实在 谈 不 上 
是 好 算法 。 这 就 如 同 仅仅 解决 旭 饱 ， 不 能 算是 生活 幸福 一 样 。 而 层次 4 
0 


因此 算法 的 正确 性 在 大 部 分 情况 下 都 不 可 能 用 程序 来 证 明 ， 而 是 用 数 
学 方法 证 明 的 。 证 明 一 个 复杂 算法 在 所 有 层次 上 都 生 正 确 的 ， 代 价 非 
ο κο ο ο κ. 
YEE ο 


好 算法 还 有 什么 特征 呢 ? 

很 好 ， 我 听 到 了 说 算法 容易 理解 。 没 错 ， 束 是 它 。 

2.6.2 ”可 读 性 

可 读 性 : 算法 设计 的 另 一 目的 是 为 了 便于 阅读 、 理 解 和 交流 。 


可 读 性 高 有 助 于 人 们 理解 算法 ， 睡 汲 难 懂 的 算法 往往 隐 仿 错误， 不 易 
被 发 现 ， 并 且 难 于 调试 和 修改 。 


我 在 很 久 以 前 曾经 看 到 过 一 个 网 友 写 的 代码 ， 他 号 称 这 程序 是 “用 史上 
最 少 代码 实现 俄罗斯 方块 ”。 因 为 我 目 己 也 写 过 类 似 的 小 游戏 程序 ， 所 
以 想 研 究 一 下 他 是 如 何 写 的 。 由 于 他 追求 的 是 “最 少 代 码 ” 这 样 的 极 
致 ， 使 得 他 的 代码 真 的 不 好 理解 。 也 许 除 了 计算 机 和 他 自己 ， 绝 大 多 
数 人 是 看 不 懂 他 的 代码 的 。 

我 们 写 代 码 的 目的 ， 一 方面 是 为 了 让 计算 机 执行 ， 但 还 有 一 个 重要 的 
目的 是 为 了 便于 他 人 阅读 ， 让 人 理解 和 交流 ， 自 己 将 来 也 可 能 阅读 ， 
如 果 可 读 性 不 好 ， 时 间 长 了 自己 都 不 知道 写 了 些 什 么 。 可 读 性 是 算法 
(也 包括 实现 它 的 代码 ) 好 坏 很 重要 的 标志 。 

2.6.3 ”健壮 性 


一 个 好 的 算法 还 应 该 能 对 输入 数据 不 合法 的 情况 做 合适 的 处 理 。 比 如 
输入 的 时 间或 者 距离 不 应 该 是 负 效 等 。 


健壮 性 ， 当 输入 数据 不 合法 时 ， 算 法 也 能 做 出 相关 处 理 ， 而 不 是 产生 
异常 或 莫名 其 妙 的 结果 。 


2.6.4 时 间 效 率 高 和 存储 量 低 
最 后 ， 好 的 算法 还 应 该 具备 时 间 效率 高 和 存储 量 低 的 特点 。 


时 间 效 率 指 的 是 算法 的 执行 时 间 ， 对 于 同一 个 问题 ， 如 果 有 多 个 算法 
能 够 解决 ， 执 行 时 间 短 的 算法 效率 高 ， 执 行 时 间 长 的 效率 低 。 存 储量 
需求 指 的 是 算法 在 执行 过 程 中 需要 的 最 大 存储 空间 ， 主 要 指 算法 程序 
运行 时 所 占用 的 内 存 或 外 部 便 强 存储 空间 。 设 计算 法 应 该 尽量 满足 时 
间 效率 高 和 存储 量 低 的 需求 。 在 生活 中 ， 人 们 都 希望 伦 最 少 的 钱 ， 用 
最 短 的 时 间 ， 办 最 大 的 事 ， 算 法 也 是 一 样 的 思想 ， 最 好 用 最 少 的 存储 
空间 ， 人 花 最 少 的 时 间 ， 办 成 同样 的 事 台 是 好 的 算法 。 求 100 个 人 的 高 考 
成 绩 平均 分 ， 与 求全 省 的 所 有 考生 的 成 绩 平均 分 在 占用 时 间 和 内 在 存 
储 上 是 有 非常 大 的 差异 的 ， 我 们 目 然 是 追求 可 以 高 效率 和 低 存 储量 的 
算法 来 解决 问题 。 


综 上 ， 好 的 算法 ， 应 该 具有 正确 性 、 可 读 性 、 健 壮 性 、 高 效率 和 低 存 
储量 的 特征 。 


27 ”算法 效率 的 度量 方法 


刚才 我 们 提 到 设计 算法 要 提高 效率 。 这 里 效率 大 都 指 算法 的 执行 时 
间 。 那 么 我 们 如 何 度量 一 个 算法 的 执行 时 间 呢 ? 

正 所 谓 “ 是 又 子 是 马 ， 拉 出 来 多 这”。 比 较 容易 想到 的 方法 就 是 ， 我 们 
通过 对 算法 的 数据 测试 ， 利 用 计算 机 的 计时 功能 ， 来 计算 不 同 算法 的 
效率 是 高 还 是 低 。 

2.7.1 事后 统计 方法 

事后 统计 方法 ; 这 种 方法 主要 是 通过 设计 好 的 测试 程序 和 数据 ， 利 用 
计算 机 计时 器 对 不 同 算法 编制 的 程序 的 运行 时 间 进 行 比 较 ， 从 而 确定 
算法 效率 的 高 低 。 

但 这 种 方法 显然 是 有 很 大 缺陷 的 : 


ο 必须 依据 算法 事先 编制 好 程序 ， 这 通常 需要 花费 大 量 的 时 间 和 精 
ο «αμ 
ZS 1? 

时 间 的 比较 依赖 计算 机 硬件 和 软件 等 环境 因素 ， 有 时 会 掩盖 算法 
本 身 的 优 和 劣 。 要 知道 ， 现 在 的 一 台 四 核 处 理 器 的 计算 机 ， 跟 当年 
286、386、486 等 老爷 和 爷 辈 的 机 器 相 比 ， 在 处 理 算法 的 运算 速度 
上 ， 是 不 能 相提并论 的 ， 而 所 用 的 操作 系统 、 编 译 器 、 运 行 框架 
等 软件 的 不 同 ， 也 可 以 影响 它们 的 结果 就 算是 同一 台 机 器 ， 
CPU 使 用 率 和 内 存 占 用 情况 不 一 样 ， 也 会 造成 细微 的 差异 。 
算法 的 测试 数据 设计 困难 ， 并 且 程 序 的 运行 时 间 往 往 还 与 测试 数 
据 的 规模 有 很 大 关系 ， 效 率 高 的 算法 在 小 的 测试 数据 面前 往往 得 
不 到 体现 。 比 如 10 个 数字 的 排序 ， 不 管用 什么 算法 ， 差 异 几 乎 是 
零 。 而 如 果 有 一 百 万 个 随机 数字 排序 ， 那 不 同 算法 的 差异 就 非常 
大 了 。 那 么 我 们 为 了 比较 算法 ， 到 底 用 多 少数 据 来 测试 ， 这 是 很 
难 判断 的 问题 。 


基于 事后 统计 方法 有 这 样 那样 的 缺陷 ， 我 们 考虑 不 予 采纳 。 
2.7.2 ”事前 分 析 估 算 方法 


我 们 的 计算 机 前 者 们 ， 为 了 对 算法 的 评判 更 科学 ， 人 研究 出 了 一 种 叫做 
事前 分 析 佑 算 的 方法 。 


ο ο ο ορ ος 


经 过 分 析 ， 我 们 发 现 ， 一 个 用 高 级 程序 语言 编写 的 程序 在 计算 机 上 运 
行 时 所 消耗 的 时 间 取 决 于 下 列 因 素 : 1. 算 法 采用 的 策略 、 方 法 。2. 编 
译 产 生 的 代码 质量 。3. 问 题 的 输入 规模 。4. 机 器 执行 指令 的 速度 。 
第 1 条 当然 是 算法 好 坏 的 根本 ， 第 2 条 要 由 软件 来 文 持 ， 第 4 条 要 看 硬件 
性 能 。 也 就 是 说 ， 抛 开 这 些 与 计算 机 人 硬件、 软件 有 关 的 因素 ， 一 个 各 
序 的 运行 时 间 ， 依 赖 于 算法 的 好 坏 和 问题 的 输入 规模 。 所 请 问题 输入 
规模 十指 输入 量 的 多 少 。 

我 们 来 看 看 今天 刚 上 课时 举 的 例子 ， 两 种 求 和 的 算法 : 


第 一 种 算法 : 


beastie Gli) Seyi ES /* HTK */ 
oe (Col αι ες es) /* BUTT n+ */ 


i 


SS 


sum = sum + i; * Henk */ 


} 


printf("%d", sum); 


N 


R 


第 二 种 算法 : 


int sum = 0,n = 100; TEU aie ey: 
SUNN) Sen Ri Sey, 
printf("%d", sum); LEPC abe eh 


显然 ， 第 一 种 算法 ， 执 行 了 1+(n+1)+n+1 次 =2n+3 次 ， 而 第 二 种 算法 ， 
是 1+1+1=3 次 。 事 实 上 两 个 算法 的 第 一 条 和 最 后 一 条 语句 是 一 样 的 ， 所 
以 我 们 关注 的 代码 其 实 是 中 间 的 那 部 分 ， 我 们 把 循环 看 作 一 个 整体 ， 
忽略 头 尾 循 环 判断 的 开销 ， 那 么 这 两 个 算法 其 实 就 是 n 次 与 1 次 的 差 
距 。 算 法 好 坏 显 而 易 见 。 


我 们 再 来 延伸 一 下 上 面 这 个 例子 : 


Πε a eX cl RO nel OOF Ale CO, 


for (ο Επ shore ial alae) 


ξ 
TOE G Den 
uh 
ΧΕ; /* 执行 nxn 次 */ 
sum = sum + x; 
} 


printf("%d", sum); μος οὐ 


这 个 例子 中 ，i 从 1 到 100， 每 次 都 要 让 j 循 环 100 次 ， 而 当中 的 x++ 和 
sum=sumt+x; 其 实 就 是 1+2+3+...+10000， 也 就 是 100 


2 次 ， 所 以 这 个 算法 当中 ， 循 环 部 分 的 代码 整体 需要 执行 n 


2 (忽略 循环 体 头 尾 的 开销 ) 次 。 显 然 这 个 算法 的 执行 次 数 对 于 同样 的 
输入 规模 n=100， 要 多 于 前 面 两 种 算法 ， 这 个 算法 的 执行 时 间 随 着 n 的 
增加 也 将 远 远 多 于 前 面 两 个 。 


此 时 你 会 看 到 ， 测 定 运行 时 间 节 可 靠 的 方法 区 是 计算 对 运行 时 间 有 消 
耗 的 基本 操作 的 执行 次 效 。 运 行 时 间 与 这 个 计数 成 正比 。 


我 们 不 关心 编写 程序 所 用 的 程序 设计 语言 是 什么 ， 也 不 关心 这 些 程序 
将 跑 在 什么 样 的 计算 机 中 ， 我 们 只 关心 它 所 实现 的 算法 。 这 样 ， 不 计 
那些 循环 索引 的 递增 和 循环 终止 条 件 、 变 量 声 明 、 打 印 结 来 等 操作 ， 
最 终 ， 在 分 析 程 序 的 运行 时 间 时 ， 最 重要 的 是 把 程序 看 成 是 独立 于 程 
序 设计 语言 的 算法 或 一 系列 步 又。 


可 以 从 问题 描述 中 得 到 启示 ， 同 样 问题 的 输入 规模 是 n， 求 和 算法 的 第 
一 种 ， 求 1+2+...+n 需 要 一 段 代码 运行 na 次 。 那 么 这 个 问题 的 输入 规模 使 
得 操作 数量 是 f(n)=n， 显 然 运 行 100 次 的 同一 段 代码 规模 是 运算 10 次 的 
10 倍 。 而 第 二 种 ， 无 论 n 为 多 少 ， 运 行 次 数 都 为 1， 即 f(n)=1; 第 三 种 ， 
运算 100 次 是 运算 10 次 的 1000 倍 。 因 为 它 是 f(n)=n?。 

我 们 在 分 析 一 个 算法 的 运行 时 间 时 ， 重 要 的 是 把 基本 操作 的 数量 与 输 


入 规模 关联 起 来 ， 即 基本 操作 的 数量 必须 表示 成 输入 规模 的 函数 (如 
图 2-7-1 所 示 ) ο 


不 同 算法 的 操作 数量 对 比 


12345 6 7 8 ὃ 10 


问题 输入 规模 n 


图 2-7-1 


我 们 可 以 这 样 认为 ， 随 着 n 值 的 越 来 越 大 ， 它 们 在 时 间 效 率 上 的 差异 也 
束 越 来 越 大 。 好 比 你们 当中 有 些 人 每 天 部 在 学 习 ， 我 指 有 用 的 学 习 ， 
而 不 是 只 为 考试 的 死 读 书 ， 每 天 痢 在 进步 ， 而 为 一 些 人 ， 打 打 游 戏 ， 
睡 睡 大 觉 。 入校 时 大 家 都 一 样 ， 但 毕业 时 结果 可 能 就 大 不 一 样 ， 前 者 
名 企 争 抢 着 要 ， 后 者 求职 无 门 。 


2.8 ”函数 的 渐 近 增长 


我 们 现在 来 判断 一 下 ， 以 下 两 个 算法 A 和 B 哪 个 更 好 。 假 设 两 个 算法 的 
输入 规模 都 是 n， 算 法 A 要 做 2n+3 次 操作 ， 你 可 以 理解 为 先 有 一 个 n 次 的 
循环 ， 执 行 完成 后 ， 再 有 一 个 n 次 循环 ， 最 后 有 三 次 赋值 或 运算 ， 共 
2n+3 次 操作 。 算 法 B 要 做 3n+1 次 操作 。 你 觉得 它们 谁 更 快 呢 ? 


准确 说 来 ， 答 案 是 不 一 定 的 〈 如 表 2-8-1 所 示 ) ° 


次 数 | 算法 A(2n+3) | 算法 A(2n) | 算法 B(3n+1) | 算法 B (3n 
n=] 9 2 4 3 
n=2 1 4 / 6 
n=3 9 6 10 9 
n= 10 23 20 31 30 
n= 100 203 200 301 300 
#22-8-1 


当 n=1 时 ， 算 法 A 效率 不 如 算法 B (次 数 比 算法 B 要 多 一 次 ) 。 而 当 n=2 
时 ， 两 者 效率 相同 ， 当 n>2 时 ， 算 法 A 殉 开始 优 于 算法 B 了 ， 随 者 n 的 增 
加 ， 算 法 A 比 算法 B 越 来 越 好 了 (执行 的 次 数 比 B 要 少 ) 。 于 是 我 们 可 
以 得 出 结论 ， 算 法 A 总 体 上 要 好 过 算法 B。 


此 时 我 们 给 出 这 样 的 定义 ， 输 入 规模 n 在 没有 限制 的 情况 下 ， 只 要 超过 
σα XA EAT A ΤΕΝ, FUN Be He tk 


函数 的 渐 近 增长 : 给 定 两 个 函数 fm 和 gm， 如 果 存 在 一 个 整数 N， 使 
的 n>N，f@) 总 是 比 g(n) 大 ， 那 么 ， 我 们 说 f(n) 的 增长 渐 近 快 
gm) ° 


从 中 我 们 发 现 ， 随 独 n 的 增 大 ， 后 面 的 +3 还 是 +1 其 实生 不 影响 最 终 的 算 
法 变化 的 ， 例 如 算法 A' 与 算法 B'， 所 以 ， 我 们 可 以 忽略 这 些 加 法 常数 。 
后 面 的 例子 ， 这 样 的 常数 被 忽略 的 意义 可 能 会 更 加 明显 。 


ο το 算法 C 是 4n+8， 算 法 D 是 2n “+1 〈 如 表 2-8-2 所 
ην 


RR “算法 C (4n+8) BEC (n) | RED (2n +1 ) | 算法 D (π') 
n=1 12 1 3 1 
n=? 16 2 0 4 
n=3 20 3 19 9 
n=10 48 10 201 100 
n= 100 408 100 20 001 10 000 
n = 1000 4008 1000 2000001 1009000 
3ς2-8-2 


当 n<3 的 时 候 ， 算 法 C 要 差 于 算法 D (因为 算法 C 次 数 比 较 多 ) , (AS 

n>3 后 ， 算 法 C 的 优势 束 越 来 越 优 于 算法 D 了 ， 到 后 来 更 是 远 还 胜 过 。 

而 当 后 面 的 淄 数 去 挥 后 ， 我 们 发 现 其 实 结 采 没 有 发 生 改 变 。 甚 至 我 们 
FUSE ACH, MT APSA FARA a, IAA RI AE, A 
法 C' 的 次 数 随 着 n 的 增长 ， 还 是 远 小 于 算法 D'。 也 就 是 说 ， 与 最 高 次 项 
AAFC Fs BEAN BERS - 


我 们 再 来 看 第 三 个 例子 。 算 法 E 是 2n2 +3n+1， 算 法 F 是 2n3+3n+1 (如 
表 2-8-3 所 示 ) 


RR Βεύη) 算法 E' (nr) BEF n) | RKP (n°) 
n= 1 ϐ 1 0 1 
n=2 15 4 23 8 
n=3 28 9 64 21 
n=10 231 100 2 031 1000 
n= 100 20 901 10 000 2000301 1000000 

表 2-8-3 


当 n=1 的 时 候 ， 算 法 E 与 算法 F 结 朱 相 同 ， 但 当 n>1 后 ， 算 法 E 的 优势 殉 
要 开始 优 于 算法 F， 随 着 n 的 增 大 ， 差 异 非常 明显 。 通 过 观察 发 现 ， 最 
高 次 项 的 指数 大 的 ， 函 数 随 着 n 的 增长 ， 结 果 也 会 变 得 增长 特别 快 。 


我 们 来 看 最 后 一 个 例子 。 算 法 G 是 2n9* ， 算 法 H 是 3n+1， 算 法 [是 2n“ 
+3n+1 (如 表 2-8-4 所 示 ) 5 


次 数 
n=1 
fia? 
ne 
n= 10 
n= 100 
n= 1,000 
n= 10,000 
n= 100,000 
n= 1,000,000 


表 2-8-4 


这 组 数据 应 该 束 看 得 很 清楚 。 


Βλ (2η) 


200 

20 000 

2 000 000 

200 000 000 

20 000 000 000 

2 000 000 000 000 


算法 H ( 3n+1 ) 


3001 

30 001 
300 001 
ὁ 000 001 


算法 |( 2n+3n+1 ) 


20 301 

2 003 001 

200 030 001 

20 000 300 001 
200 000 3000 001 


当 n 的 值 越 来 越 大 时 ， 你 会 发 现 ，3n+1 已 


经 没 法 和 2n ?的 结果 相 比 较 ， 最 终 几 乎 可 以 名 略 不 计 。 也 就 是 说 ， 随 着 


n 值 变 得 非常 大 以 后 ， 算 法 G 其 实 已 经 很 趋 近 于 算法 I。 于 是 我 们 可 以 得 
到 这 样 一 个 结论 ， 判 断 一 个 算法 的 效率 时 ， 为 数 中 的 第 数 和 其 他 次 要 
项 常常 可 以 忽略 ， 而 更 应 该 关注 主 项 (最 高 阶 项 ) 的 阶 数 。 


判断 一 个 算法 好 不 好 ， 我 们 只 通过 少量 的 数据 是 不 能 做 出 准确 判断 
的 。 根 据 刚才 的 几 个 样 例 ， 我 们 发 现 ， 如 果 我 们 可 以 对 比 这 几 个 算法 
的 关键 执行 次 数 函 数 的 渐 近 增长 性 ， 基 本 就 可 以 分 析出 ， 某 个 算法 ， 
随 着 n 的 增 大 ， 它 会 越 来 越 优 于 男 一 算法 ， 或 者 越 来 越 莽 于 力 一 算法 。 


这 其 实 就 是 事前 估算 方法 的 理论 依据 ， 通 过 算法 时 间 复 杂 度 来 估算 算 


法 时 间 效 率 。 


2.9 ”算法 时 间 复 杂 度 

2.9.1 算法 时 间 复 杂 度 定义 

在 进行 算法 分 析 时 ， 语 句 总 的 执行 次 数 Tn) 是 关于 问题 规模 n 的 函数 ， 
进而 分 析 T(n) 随 n 的 变化 情况 并 确定 Tn) 的 数量 级 。 算 法 的 时 间 复 灯 
度 ， 也 就 是 算法 的 时 间 量 度 ， 记 作 : Tm)=O(f(n))。 它 表示 随 问题 规模 n 
的 增 大 ， 算 法 执行 时 间 的 增长 率 和 fo) 的 增长 率 相同 ， 称 作 算法 的 渐 近 
时 间 复 杂 度 ， 简 称 为 时 间 复 杂 度 。 其 中 fo) 是 问题 规模 n 的 某 个 函数 。 
这 样 用 大 写 O() 来 体现 算法 时 间 复 杂 度 的 记 法 ， 我 们 称 之 为 大 0 记 法 。 
一 般 情况 下 ， 随 着 n 的 增 大 ，T(n) 增 长 最 慢 的 算法 为 最 优 算法 。 

显然 ， 由 此 算法 时 间 复 杂 度 的 定义 可 知 ， 我 们 的 三 个 求 和 算法 的 时 间 
复杂 度 分 别 为 Om)，0(1)，O(n*)。 我 们 分 别 给 它们 取 了 非 官方 的 名 
称 ，O(1) 叫 常数 阶 、O(n) 叫 线性 阶 、O(n*) 叫 平方 阶 ， 当然 ， 还 有 其 他 
的 一 些 阶 ， 我 们 之 后 会 介绍 。 

2.9.2 ”推导 大 O 阶 方法 


那么 如 何 分 析 一 个 算法 的 时 间 复 杂 度 呢 ? 即 如 何 推导 大 0 阶 呢 ? 我们 给 
出 了 下 面 的 推 寻 方法 ， 基 本 上 ， 这 也 融 是 总 结 前 面 我 们 举 的 例子 。 


HES KOM: 

1. 用 常数 1 取代 运行 时 间 中 的 所 有 加 法 常数 。 

2. 在 修改 后 的 运行 次 数 函 数 中 ， 只 保留 最 高 阶 项 。 

3. 如 果 最 高 阶 项 存在 且 不 是 1， 则 去 除 与 这 个 项 相 乘 的 常数 。 

得 到 的 结果 就 是 大 0 阶 。 

哈 ， 仿 佛 是 得 到 了 游戏 攻略 一 样 ， 我 们 好 像 已 经 得 到 了 一 个 推导 算法 
时 间 复 杂 度 的 万 能 公式 。 可 事实 上 ， 分 析 一 个 算法 的 时 间 复 杂 度 ， 没 
有 这 么 简单 ， 我 们 还 需要 多 看 几 个 例子 。 

2.9.3 ΒΆΝ 


首先 顺序 结构 的 时 间 复 杂 度 。 下 面 这 个 算法 ， 也 就 是 刚才 的 第 二 种 算 
法 (高 斯 算法 ) ， 为 什么 时 间 复 杂 度 不 是 0(3)， 而 是 O(1)。 


int sum = 0,n = 100; EMU ae ή 
Sis Cl avy lal yf ee μις ον 
printf("%d", sum); (Fe DI ον 


这 个 算法 的 运行 次 数 画 数 是 f(n)=3。 根 据 我 们 推导 大 O 阶 的 方法 ， 第 一 
步 就 是 把 常数 项 3 改 为 1。 在 保留 最 高 阶 项 时 发 现 ， 它 根本 没有 最 高 阶 
项 ， 所 以 这 个 算法 的 时 间 复杂 度 为 0(1) 。 


E E none 
HJ, ΗΠ. 


int sum = 0, n = 100; /* PUT */ 

ST /* 执行 第 1 次 */ 
Sunes en) ene ee /* 执行 第 2 次 */ 
SU /* 执行 第 3 次 */ 
SU τα A τος /* 执行 第 4 次 */ 
In a Clean) ee 2 /* 执行 第 5 次 */ 
ES /* 执行 第 6 次 */ 
Wik = (ΕΠ) ο πι τρ /* 执行 第 7 次 */ 
SU nee /* 执行 第 8 次 */ 
Sunt =a ΠΠ ο ee /* 执行 第 9 次 */ 
e S AEN a A /* 执行 第 1 次 */ 
printf("%d", sum); TM ale, 


事实 上 无 论 n 为 多 少 ， 上 面 的 两 段 代 码 束 是 3 次 和 12 次 执行 的 差异 。 这 
种 与 问题 的 大 小 无 关 (n 的 多 少 ) ， 执 行 时 间 恒 定 的 算法 ， 我 们 称 之 为 
RAON ERRE, IERT - 


注意 : 不 管 这 个 常数 是 多 少 ， 我 们 都 记 作 O(D)， 而 不 能 是 0(3)、O(12) 
等 其 他 任何 数字 ， 这 是 初学 者 常常 犯 的 错误 。 
对 


于 分 支 结构 而 言 ， 无 论 是 真 ， 还 是 假 ， 执 行 的 次 数 都 是 恒定 的 ， 不 
会 随 着 n 的 变 大 而 发 生变 化 ， 所 以 单纯 的 分 支 结构 (不 包含 在 循环 结构 
中 ) ， 其 时 间 复 杂 度 也 是 O(1)。 


2.9.4 ”线性 阶 

线性 阶 的 循环 结构 会 复杂 很 多 。 要 确定 某 个 算法 的 阶 次 ， 我 们 常常 需 
要 确定 某 个 特定 语句 或 某 个 语句 集运 行 的 次 数 。 因 此 ， 我 们 要 分 析 算 
法 的 复杂 度 ， 关 键 就 是 要 分 析 循 环 结构 的 运行 情况 。 


下 面 这 段 代码 ， 它 的 循环 的 时 间 复 杂 度 为 O(n)， 因 为 循环 体 中 的 代码 
须要 执行 np 次 。 


πε ale 


ποιο ΙΕ ΠΟ mn 


{ 
/* 时 间 复 杂 度 为 0(1) 的 程序 步 又 序列 */ 
} 
2.9.5 ΣΙ 


下 面 的 这 段 代 码 ， 时 间 复 杂 度 义 是 多 少 呢 ? 


int count = 1; 
while (count < n) 
g 
count = Count 2; 


/* 时 间 复 杂 度 为 0(1) 的 程序 步 又 序列 */ 


由 于 每 次 count 乘 以 2 之 后 ， 就 距离 n 更 近 了 一 分 。 也 就 是 说 ， 有 和 多少 个 2 
相 乘 后 大 于 n， 则 会 退出 循环 。 由 2x=n 得 到 x=log ,n。 所 以 这 个 循环 的 
时 间 复 杂 度 为 O(logn)。 


2.9.6 ”平方 阶 


下 面 例 子 是 一 个 循环 蔡 套 ， 它 的 内 循环 刚才 我 们 已 经 分 析 过 ， 时 间 复 
FRE AO(n) ° 


pie aber ΠΡ 


Πορ (Cab ο ake ine pa) 


i 
OGE 
{ 
/* 时 间 复 杂 度 为 0(1) 的 程序 步 又 序列 */ 
J 
} 


而 对 于 外 层 的 循环 ， 不 过 是 内 部 这 个 时 间 复 杂 度 为 O(D 的 语句 ， 再 循 
环 n 次 。 所 以 这 段 代 码 的 时 间 复 杂 度 为 0m“)。 


如 果 外 循环 的 循环 次 数 改 为 了 m， 时 间 复 杂 度 就 变 为 OImxn)。 


UME ai ΠΡ 


roe (ο πο ΠΕ ο) 


tt 
πο OTS o Sp E 
{ 
/* 时 间 复 杂 度 为 0(1) 的 程序 步 又 序列 */ 
} 


所 以 我 们 可 以 总 结 得 出 ， 循 环 的 时 间 复 杂 度 等 于 循环 体 的 复杂 度 乘 以 
该 循环 运行 的 次 数 。 


ABA REX MAME, ERIS Ree DYE? 


pune: ή 
ποπ ο ο ak Kine πο) 
{ 


/* 注意 ] = 而 不 是 0 */ 


παν SN ae) 
iL 
/* 时 间 复 杂 度 为 0(1) 的 程序 步 又 序列 */ 


} 


由 于 当 i=0 时 ， 内 循环 执行 了 pn 次， 当 i=1 时 ， 执 行 了 n-1 次 ，.……. 当 证 证 1 
时 ， 执 行 了 1 次 。 所 以 总 的 执行 次 数 为 : 


π΄ 
l 


ΓΙ... 


rms | => 


用 我 们 推导 大 0 阶 的 方法 ， 第 一 条 ， ο... 党 二 
只 保留 最 高 阶 项 ， 因 此 保留 n2/2;， 第 三 4 
ee 


从 这 个 例子 ， 我 们 也 可 以 得 到 一 个 经 验 ， 其 实 理 解 大 O 推 导 不 算 难 ， 难 
的 是 对 数列 的 一 些 相 关 运 算 ， ο ο... 
所 以 想 考 人 研 的 朋友 ， 要 想 在 求 算 法 时 间 复 杂 度 αλα, 可 能 需要 
强化 你 的 数学 ， 特 别 是 数列 方面 的 知识 和 解 题 


我 们 继续 看 例子 ， 对 于 方法 调用 的 时 间 复 杂 度 又 如 何 分 析 。 


a Es πίω. ΠΡ 
ποπ (Cals (015. al np απ) 
τ 

function(i); 


} 


上 面 这 段 代 码 调用 一 个 函数 function。 


void function(int count) 


τ 
print(count); 


} 


函数 体 是 打印 这 个 参数 。 其 实 这 很 好 理解 ，function 函 数 的 时 间 复 杂 度 
是 O(1)。 所 以 整体 的 时 间 复 杂 度 为 O(n)。 


假如 function 是 下 面 这 样 的 : 


void function(int count) 


{ 
Πρ ης 
TOM oie πμ) 
{ 
/* 时 间 复 杂 度 为 0(1) 的 程序 步 又 序列 */ 
} 
h 


事实 上 ， 这 和 刚才 举 的 例子 古 一 样 的 ， 只 不 过 把 欣 侠 内 循环 放 到 了 画 
数 中 ， 所 以 最 终 的 时 间 复 杂 度 为 O(n“)。 


下 面 这 段 相 对 复杂 的 语句 : 


ΠΕ; /* 执行 次 数 为 1 */ 
function(n); /* 执行 次 数 为 n */ 
ΠΠ ΝΕΤ; 


POE (E =e Or “ας κα η ταίρι“. /* 执行 次 数 为 n 2 3/ 


{ 

function (i); 
} 
TO EEE O e N aa) /* 执行 次 数 为 n(n + 1)/2 */ 
a 

Reise ος πο 

{ 

/* 时 间 复 杂 度 为 0(1) 的 程序 步 又 序列 */ 

} 

} 


它 的 执行 次 数 fn)=1+n+n2 +n(nt+1)/2=3/2-n*+3/2-n+1, ΕΤΕ AO 
的 方法 ， 最 终 这 段 代 码 的 时 间 复 杂 度 也 是 O(n?)。 


2.10 ”常见 的 时 间 复 杂 度 
常见 的 时 间 复 杂 度 如 表 2-10-1 所 示 。 


表 2-10-1 


执行 次 数 Bayt FREAK 
12 O(1) 常数 阶 
2.5 O(n) 线性 阶 


3n? +2n+1 Omn?) 平方 阶 
Slog, n+20 O(logn) ”对 数 阶 
2n+3nlog 5 n+19 O(nlogn) nlogn 阶 
6n3+2n2 +3n+4 O(n3 ) ”立方 阶 
2 O(C2n ) ”指数 阶 


常用 的 时 间 复 洒 度 所 耗费 的 时 间 从 小 到 大 依次 是 : 


ο(1)«Ο(1οση)«Ο(π)«Ο(η1οσπ)«Ο(η 2 )<o(n 3 )<0(2 " )<o(n!)<o(n " ) 


我 们 前 面 已 经 谈 到 了 O() 常 数 阶 、OUdogm 对 数 阶 、OC 线 性 阶 、oOa@ 
2) 平 方 阶 等 ， 至 于 O(nlogn) 我 们 将 会 在 今后 的 课程 中 介绍 ， 而 像 O(n 
3)， 过 大 的 n 都 会 使 得 结果 变 得 不 现实 。 同 样 指 数 阶 O(2 


n) 和 阶乘 阶 O(n!) 等 除非 是 很 小 的 n 值 ， 否 则 哪怕 n 只 是 100， 都 古 虐 梦 般 


2.11 最 坏 情 况 与 平均 情况 


你 早晨 上 班 出 门 后 突然 想起 来 ， 手 机 环 记 市 了 ， 这 年 头 ， 钥 琵 、 钱 

包 、 手 机 三 大 件 ， 出 门 哪样 也 不 能 少 呀 。 于 是 回 家 找 。 打 开 1 ] 一 看 ， 

手机 就 在 门口 玄关 的 合子 上 ， 原 来 是 出 门 穿 鞋 时 起 记 拿 了 。 这 当然 是 
比较 好 ， 基 本 没 化 什么 时 间 寻 找 。 可 如 琳 不 是 放 在 那里 ， 你 束 得 进去 
到 处 找 ， 找 完 客 厅 找 卧室 、 找 完 卧 宇 找 厨房 、 找 完 厨 房 找 卫生 间 ， 整 
征 找 不 到 ， 时 间 一 分 一 秒 的 过 去 ， 你 突然 想起 来 ， 可 以 用 家 里 座机 打 
一 下 手机 ， 听 着手 机 铃声 来 找 呀 ， 真 是 尝 。 终 于 找到 了 ， 在 床上 枕头 
下 面 。 你 再 去 上 班 ， 迟 到 。 见 鬼 ， 这 一 年 的 全 勤 奖 ， 就 因为 找 手机 给 
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找 东 西 有 运气 好 的 时 候 ， 也 有 怎么 也 找 不 到 的 情况 。 但 在 现实 中 ， 通 
ο, EE αν ; 所 以 算 下 来 是 平 
JEWELS ° 


算法 的 分 析 也 是 类 似 ， 我 们 查找 一 个 有 n 个 随机 数字 数组 中 的 某 个 数 
字 ， 最 好 的 情况 是 第 一 个 数字 就 是 ， 那 么 算法 的 时 间 复 杂 度 为 O(1)， 
但 也 有 可 能 这 个 数字 就 在 最 后 一 个 位 置 上 待 着 ， 那 么 算法 的 时 间 复 杂 
度 承 是 DOnD)， 这 是 最 坏 的 一 种 情况 了 5 


最 坏 情况 运行 时 间 是 一 种 保证 ， 那 惑 是 运行 时 间 将 不 会 再 坏 了 。 在 应 
用 中 ， 这 是 一 种 最 重要 的 需求 ， 通 党， 除非 特别 指定 ， 我 们 提 到 的 运 
行 时 间 都 是 最 坏 情 况 的 运行 时 间 5 


而 平均 运行 时 间 也 就 是 从 概率 的 角度 看 ， 这 个 数字 在 每 一 个 位 置 的 可 
能 性 是 相同 的 ， 所 以 平均 的 查找 时 间 为 /2 次 后 发 现 这 个 目标 元 素 。 


平均 运行 时 间 是 所 有 情况 中 最 有 意义 的 ， 因 为 它 是 期 望 的 运行 时 间 。 
也 就 是 说 ， 我 们 运行 一 段 程序 代码 时 ， 是 希望 看 到 平均 运行 时 间 的 。 
可 现实 中 ， 平 均 运 行 时 间 很 难 通过 分 析 得 到 ， 一 般 都 是 通过 运行 一 定 
数量 的 实验 数据 后 估算 出 来 的 。 


对 算法 的 分 析 ， 一 种 方法 是 计算 所 有 情况 的 平均 值 ， 这 种 时 间 复 杂 度 
的 计算 方法 称 为 平均 时 间 复 杂 度 。 另 一 种 方法 是 计算 最 坏 情况 下 的 时 
间 复 杂 度 ， 这 种 方法 称 为 最 坏 时 间 复 杂 度 。 一 般 在 没有 特殊 说 明 的 情 
况 下 ， 都 是 指 最 坏 时 间 复 杂 度 。 


2.12 ”算法 空间 复杂 度 


我 们 在 写 代 码 时 ， 完 全 可 以 用 空间 来 换取 时 间 ， 比 如 说 ， 要 判断 某 某 
年 是 不 是 闫 年 ， 你 可 能 会 花 一 点 心思 写 了 一 个 算法 ， 而 且 由 于 是 一 个 
算法 ， 也 就 意味 着 ， 每 次 给 一 个 年 份 ， 都 是 要 通过 计算 得 到 是 否 是 国 
年 的 结果 。 还 有 另 一 个 办 法 就 是 ， 事 先 建立 一 个 有 2050 个 元 素 的 数组 
(年 数 略 比 现实 多 一 点 ) ， 然 后 把 所 有 的 年 份 按 下 标的 数字 对 应 ， 如 
果 是 半年 ， 此 数组 项 的 值 就 是 1， 如 果 不 是 值 为 0。 这 样 ， 所 请 的 判断 
某 一 年 是 否 是 闫 年 ， 就 变 成 了 查找 这 个 数组 的 某 一 项 的 值 是 多 少 的 问 
题 。 此 时 ， 我 们 的 运算 是 最 小 化 了 ， 但 是 硬盘 上 或 者 内 存 中 需要 存储 
这 2050 个 0 和 1。 


这 是 通过 一 笔 空间 上 的 开销 来 换取 计算 时 间 的 小 技巧 。 到 原 哪 一 个 
好 ， 其 实 要 看 你 用 在 什么 地 方 。 


算法 的 空间 复杂 度 通 过 计算 算法 所 需 的 存储 空间 实现 ， 算 法 空间 复杂 
度 的 计算 公式 记 作 : S(n)=O((n))， 其 中 ，n 为 问题 的 规模 ，f(n) 为 语句 
关于 n 所 占 存 储 空间 的 函数 。 


一 般 情 况 下 ， 一 个 程序 在 机 器 上 执行 时 ， 除 了 需要 存储 程序 本 身 的 指 
令 、 和 常数 、 变 量 和 输入 数据 外 ， 还 需要 存储 对 数据 操作 的 存储 单元 。 
若 输 入 数据 所 占 空间 只 取决 于 问题 本 身 ， 和 算法 无 关 ， 这 样 只 需要 分 
析 该 算法 在 实现 时 所 需 的 辅助 单元 即 可 。 若 算法 执行 时 所 需 的 辅助 空 
间 相 对 于 输入 数据 量 而 言 是 个 常数 ， 则 称 此 算法 为 原 地 工作 ， 空 间 复 
杂 度 为 O(1)。 


1835, 我 们 都 使 用 “时 间 复 杂 度 ”来 指 运行 时 间 的 需求 ， 使 用 “空间 复杂 
度 ” 指 空间 需求 。 当 不 用 限定 词 地 使 用 “复杂 度 ”" 时 ， 通 常 都 是 指 时 间 复 
杂 度 。 显 然 我 们 这 本 书 重点 要 讲 的 还 是 算法 的 时 间 复 杂 度 的 问题 ο 
2.13 ”总 结 回顾 

不 容易 ， 终 于 又 到 了 总 结 的 时 间 。 


我 们 这 一 章 主 要 谈 了 算法 的 一 些 基本 概念 。 谈 到 了 数据 结构 与 算法 的 
天 系 是 相互 依赖 不 可 分 割 的 。 


算法 的 定义 ， 算法 是 解决 特定 问题 求解 步 又 的 拍 述 ， 在 计算 机 中 为 指 
令 的 有 限 序列 ， 并 且 每 条 指令 表示 一 个 或 多 个 操作 。 


算法 的 特性 : 有 穷 性 、 确 定性 、 可 行 性 、 输 入 、 输 出 。 
ο ο ο ο ο ο, 


算法 特性 与 算法 设计 容易 混 ， 需 要 对 比 记 忆 。 
算法 的 度量 方法 ;事后 统计 方法 〈 个 科学 、 不 准确 ) 、 事 前 分 析 信 算 


法 


在 讲解 如 何 用 事前 分 析 估算 方法 之 前 ， 我 们 先 给 出 了 画 数 渐 近 增长 的 
定义 。 


函数 的 渐 近 增长 : AEAN Mg), WRENN, {8 
得 对 于 所 有 的 n>N，fo) 总 是 比 gm 大 ， 那 么 ， 我 们 说 fm) 的 增长 痢 近 快 
于 g(n)。 于 是 我 们 可 以 得 出 一 个 结论 ， 判 断 一 个 算法 好 不 好 ， 我 们 只 通 
过 少量 的 数据 是 不 能 做 出 准确 判断 的 ， 如 末 我 们 可 以 对 比 算法 的 关键 
执行 次 数 画 数 的 渐 近 增长 性 ， 基 本 避 ® 可 以 分 析出 ， 某 个 算法 ， 随 着 n 的 
变 大 ， 它 会 越 来 越 优 于 为 一 算法 ， 或 者 越 来 越 伟 于 男 一 算法 。 

然后 给 出 了 算法 时 间 复 杂 度 的 定义 和 推导 大 0 阶 的 步骤。 
推导 大 O 阶 : 

。 用 肖 数 1 取代 运行 时 间 中 的 所 有 加 法 弟 数 。 

。 在 修改 后 的 运行 次 数 函 数 中 ， 只 保留 最 高 阶 项 。 

ο 如 采 最 高 阶 项 存在 且 不 是 1， 则 去 除 与 这 个 项 相 乘 的 利 数 。 
得 到 的 结 朱 束 是 大 0 阶 。 
通过 这 个 步 驼 ， 我 们 可 以 在 得 到 算法 的 运行 次 数 表达 式 后 ， 很 快 得 到 
它 的 时 间 复 杂 度 ， 即 大 0 阶 。 同 时 我 也 提醒 了 大 家 ， 其 实 推导 大 0 阶 很 
容易 ， 但 如 何 得 到 运行 次 数 的 表达 式 却 是 需要 数学 功 瓜 的 。 
接着 我 们 给 出 了 常见 的 时 间 复 洒 度 所 耗 时 间 的 大 小 排列 : 


0(1)<0(1lo0gn)<0(n)<0(nlogn)<0(n 2 )<o(n 3 )<0(2 " )<o(n!)<o(n " ) 


最 后 ， 我 们 给 出 了 关于 算法 最 坏 情况 和 平均 情况 的 概念 ， 以 及 空间 复 
杂 度 的 概念 。 


214 ”结尾 语 


很 多 学 生 ， 学 了 四 年 计算 机 专业 ， 很 多 程序 员 ， 做 了 很 长 时 间 的 编程 
工作 ， 却 始终 都 弄 不 明白 算法 的 时 间 复 洒 度 的 估算 ， 这 是 很 可 翡 的 一 
件 事 。 因 为 弄 不 清楚 ， 所 以 也 整 从 不 深究 目 己 写 的 代码 是 否 效 率 低 
下 ， 是 不 是 可 以 通过 优化 让 计算 机 更 加 快速 高 效 。 


他 们 通 间 的 借口 是 ， 现 在 CPU 越 来 越 快 ， 根 本 不 用 考虑 算法 的 优 乡 ， 
实现 功能 即 可 ， 用 户 感觉 不 到 算法 好 坏 造 成 的 快慢 。 可 事实 真是 这 样 


吗 ? 还 是 让 我 们 用 数据 来 说 话 吧 。 
假设 CPU 在 短 短 几 年 间 ， 速 度 提高 了 100 倍 ， 这 其 实 已 经 很 夸张 了 。 而 
我 们 的 某 个 算法 本 可 以 写 出 时 间 复 杂 度 是 O(n) 的 程序 ， 却 写 出 了 O(n?) 
的 程序 ， 仅 仅 因 为 容易 想到 ， 也 容易 写 。 即 在 OO“ ) 的 时 间 复 杂 度 算法 
程序 下 ， 速 度 其 实 只 提高 了 10 倍 
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图 2-14-1 


希望 大 家 在 今后 的 学 习 中 ， 好 好 利用 算法 分 析 的 工具 ， 改 进 目 己 的 代 
码 ， 让 计算 机 轻松 一 点 ， 这 样 你 束 更 加 胜 人 一 筹 。 


第 3 章 线性 表 


启示 

线性 表 : 

零 个 或 多 个 数据 元 素 的 有 限 序 列 。 
3.1 开场 白 


各 位 同学 ， 大 家 好 。 


今天 我 们 要 开始 学 习 数 据 结构 中 最 毅 用 和 最 简单 的 一 种 结构 ， 在 介绍 
它 之 前 先 讲 个 例子 。 


我 经 肖 下 午 去 幼儿 园 接 送 儿子 ， 每 次 都 能 在 门口 看 到 老师 带 着 小 朋友 
们 ， 一 个 拉 痢 另 一 个 的 衣服 ， 依 次 从 教 宝 出来。 而 且 我 发 现 很 有 规律 
的 是 ， 每 次 他 们 的 次 序 都 是 一 样 。 比 如 我 儿子 排 在 第 5 个 ， 每 次 他 都 是 
在 第 5 个 ， 前 面 同样 是 那个 小 女孩 ， 后 面 一 直 是 那个 小 男孩 。 这 点 让 我 
很 奇怪 ， 为 什么 一 定 要 这 样 ? 


有 一 天 我 区 问 老 师 原因 。 她 告诉 我 ， 为 了 保障 小 朋友 的 安全 ， 避 免 漏 
掉 小 朋友 ， 所 以 给 他 们 安排 了 出 门 的 次 序 ， 事 先 规 定好 了 ， 谁 在 谁 的 
前 面 ， 谁 在 谁 的 后 面 。 这 样 养 成 习惯 后 ， 如 果 有 谁 没 有 到 位 ， 他 前 面 
和 后 面 的 小 朋友 吏 会 主动 报告 老师 ， 茶 人 不 在 。 即 使 以 后 如 果 要 外 出 
到 公园 或 博物 饰 等 情况 下 ， 老 师 也 可 以 很 快 地 清点 人 数 ， 万 一 有 人 走 
丢 ， 也 能 在 最 快 时 间 知 道 ， 及 时 去 寻找 。 


我 一 想 ， 还 真是 这 样 。 小 朋友 们 始终 按照 次 序 排队 做 事 ， 出 意外 的 情 
况 束 可 能 会 少 很 多 。 毕 葛 ， 遵 守 秩序 是 文明 的 标志 ， 应 该 从 娃娃 抓 
起 。 而 且 ， 真 要 有 人 丢失 ， 小 孩子 反而 十 最 认真 负责 的 监督 员 。 


再 看 看 门 外 的 这 帮 家 长 们 ， 都 挤 在 大 门口 ， 哪 个 分 得 清 他 们 谁 是 谁 
呀 。 与 小 孩子 们 的 井然 有 序 形成 了 鲜明 的 对 比 。 哎 ， 有 时 大 人 的 所 作 
所 为 ， 其 实 还 不 如 孩子 。 


αρ 其 实 束 古今 天 我 们 要 介绍 的 数据 结构 ， 线 性 


3.2 ”线性 表 的 定义 


线性 表 ， ο ντ αυ 到 ， 是 具有 像 线 一 样 的 性 质 的 表 。 在 广 
场 上 ， 有 很 多 人 分 散在 各 处 ， 当 中 有 些 是 小 朋友 ， 可 也 有 很 多 大 人 ， 
甚至 还 有 不 少 宠物 ， 这 些小 朋友 的 数据 对 于 整个 广场 人 群 来 说 ， 不 能 
征 线 性 表 的 结构 。 但 像 刚 才 提 到 的 那样 ， 一 个 班级 的 小 朋友 ， 一 
跟着 一 个 排 着 队 ， 有 一 个 打头 ， 有 一 个 收尾 ， 当 中 的 小 朋友 每 一 个 都 
知道 他 前 面 一 个 是 谁 ， 他 后 面 一 个 是 谁 ， 这 样 如 同 有 一 根 线 把 他 们 串 
联 起 来 了 。 束 可 以 称 之 为 线性 表 。 


线性 表 (List) : 零 个 或 多 个 数据 元 素 的 有 限 序列 。 
这 里 需要 强调 几 个 关键 的 地 方 。 


首先 它 是 一 个 序列 。 也 就 是 说 ， 元 素 之 间 是 有 顺序 的 ， 阁 元 素 存在 多 
个 ， 则 第 一 个 元 素 无 前 驱 ， 骤 后 一 个 元 素 无 后 继 ， 其 他 每 个 元 素 都 有 
且 只 有 一 个 前 弛 和 后 继 。 如 采 一 个 小 朋友 去 拉 两 个 小 朋友 后 面 的 衣 
服 ， 那 融 不 可 以 排 成 一 从 了 ; 同样 ， 如 采 一 个 小 朋友 后 面 的 衣服 ， 被 
两 个 其 至 多 个 小 朋友 拉手， 这 其 实 是 在 打架 ， 而 不 是 有 序 排队 。 


然后 ， 线 性 表 强 调 是 有 限 的 ， 小 朋友 班级 人 数 是 有 限 的 ， 元 素 个 数 当 
然 也 是 有 限 的 。 事 实 上 ， 在 计算 机 中 处 理 的 对 象 都 是 有 限 的 ， 那 种 无 
限 的 数列 ， 只 存在 于 数学 的 概念 中 。 


如 果 用 数学 语言 来 进行 定义 。 可 如 下 : 
A RE RION (ay, ..., Agi, ais Apis ..., ἃῃ) , Nk Pai Ἡ 
mas ΗΝ 称 ai 1 是 ai 的 直接 前 驱 元 素 ， ἃμ ea, 的 直接 


后 继 元 素 。 当 i=1，2，..….，n-1 时 ，ai; 有 且 仅 有 一 个 直接 后 继 ， 当 i=2， 
3, ...., oY, a, A BMA 一 个 直接 前 驱 。 如 图 3-2-1 所 示 。 


图 3-2-1 

所 以 线性 表 元 素 的 个 数 n (20) 定义 为 线性 表 的 长 度 ， 当 n=0 时 ， 称 为 
在 非 空 表 中 的 每 个 数据 元 素 都 有 一 个 确定 的 位 置 ， 如 ai 是 第 一 个 数据 
JTA, a, 是 最 后 一 个 数据 元 素 ，a; 是 第 i 个 数据 元 素 ， 称 为 数据 元 素 a; 
在 线性 表 中 的 位 序 。 

我 现在 说 一 些 数 据 集 ， 大 家 来 判断 一 下 是 否 是 线性 表 。 


先 来 一 个 大 家 最 感 兴 趣 的 ， 一 年 里 的 星座 列表 ， 是 不 是 线性 表 呢 ?如 
图 3-2-2 所 示 。 


BÈN, 
+ | 了 
图 3-2-2 


当 伏 征 ， 星 座 通 单 都 是 用 日 插座 打头 ， 双 鱼 座 收尾 ， 当 中 的 星座 都 有 
前 驱 和 后 继 ， 而 且 一 共 也 只 有 十 二 个 ， 所 以 它 完全 符合 线性 表 的 定 
ne 


个 经 理 都 有 各 目的 下 属 和 员工 。 这 样 的 组 织 架 构 十 不 是 线性 天 系 呢 ? 
不 是 ， 为 什么 不 是 呢 ? 哦 ， 因 为 每 一 个 元 素 ， 都 有 不 只 一 个 后 继 ， 所 


以 它 不 是 线性 表 。 那 种 让 一 个 总 经 理 只 管 一 个 总 监 ， 一 个 总 监 只 管 


Β 
ἃ 


个 经 理 ， 一 个 经 理 只 管 一 个 员工 的 公司 ,俗称 皮包 公司 ， 岗 位 设置 等 
于 驶 是 在 忽悠 外 人 。 


班级 同学 之 间 的 友谊 关系 ， 是 不 是 线性 关系 ? 哈哈 ， 不 是 ， 因 为 每 个 
人 都 可 以 和 多 个 同学 建立 友谊 ， 不 满足 线性 的 定义 。 嗯 ? 有 人 说 爱情 
关系 束 古 了 。 胡 扯 ， 难 道 每 个 人 都 要 有 一 个 爱 的 人 和 一 个 爱 目 己 的 

人 ， 而 且 他 们 还 部 不 可 以 重复 受 同 一 个 人 这 样 的 情况 出 现 ， 最 终 形成 
一 个 班级 情感 人 物 串 联 ? 这 怎么 可 能 ， 也 许 网 络 小 说 里 可 能 出 现 ， 但 
现实 中 是 不 可 能 的 。 


班级 同学 的 点 名 册 ， 是 不 是 线性 表 ? 是 ， 这 和 刚才 的 友谊 关系 是 完全 
不 同 了 ， 因 为 它 是 有 限 序列 ， 也 满足 类 型 相同 的 特点 。 这 个 点 名 册 
(如 表 3-2-1 所 示 ) 中 ， 每 一 个 元 素 除 学 生 的 学 号 外 ， 还 可 以 有 同学 的 
姓名 、 性 别 、 出 生年 月 什么 的 ， 这 其 实 就 是 我 们 之 前 讲 的 数据 项 。 在 
较 复杂 的 线性 表 中 ， 一 个 数据 元 素 可 以 由 若干 个 数据 项 组 成 。 


学 号 | 姓名 | 性别 出生 年 月 JEW 


1 z, 5, 19903 | Rema 1 F203 5 


2 | 李 四 g (19048 RES AOE 
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表 3-2-1 


一 群 同学 排队 严 演 唱 会 门票 ， 每 人 限购 一 张 ， 此 时 排队 的 人 人 群 古 不 是 
线性 表 ? 是 ， 对 的 。 此 时 来 了 三 个 同学 要 插 当 中 一 个 同学 A 的 队 ， 说 同 


学 A 之 前 拿 着 的 三 个 书包 就 是 用 来 占 位 的 ， 书 包 也 算是 在 排队 。 如 果 你 
征 后 面 早已 来 排队 的 同学 ， 你 们 愿 不 愿意 ” 肯定 不 原意， 书包 怎么 能 
算 排队 的 人 呢 ， 如 有 果 这 也 算 ， 我 浑 映 上 下 的 衣服 裤子 都 在 排队 了 。 于 
是 小 让 这 三 个 人 进来 


这 里 用 线性 表 的 定义 来 说 ， 是 什么 理由 ? 咽 ， 因 为 要 相同 类 型 的 数 
据 ， 书 包 根 本 不 算是 人 ， 当 然 排 队 无 效 ， 三 个 人 想 不 郁 而 获 ， 目 然 遭 
到 大 家 的 谴责 。 看 来 大 家 的 线性 表 学 得 部 不 错 。 


3.3 ”线性 表 的 抽象 数据 类 型 


前 面 我 们 已 经 给 了 线性 表 的 定义 ， 现 在 我 们 来 分 析 一 下 ， 线 性 表 应 该 
有 一 些 什么 样 的 操作 呢 ? 


还 是 回 到 刚才 幼儿 园 小 朋友 的 例子 ， 老 师 为 了 让 小 朋友 有 秩序 地 出 
入 ， 所 以 束 考 虚 给 他 们 排 一 个 队 ， 并 且 是 长 期 使 用 的 顺序 ， 这 个 考虑 
和 安排 的 过 程 其 实 就 是 一 个 线性 表 的 创建 和 初始 化 过 程 。 


一 开始 没 经 验 ， 把 小 朋友 排 好 队 后 ， 发 现 有 的 高 有 的 矮 ， 队 伍 很 难 
人 ο οᾱ 


排 好 了 队 ， 我 们 随时 可 以 叫 出 队伍 某 一 位 置 的 小 朋友 名 字 及 他 的 具体 
情况 。 比 如 有 家 长 问 ， 队 伍 里 第 五 个 孩子 ， 怎 么 这 么 调度 ， 他 叫 什么 
AFH, EW ARREAK, AMESA ANILE, MWS 
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线性 表 操 作 。 


还 有 什么 呢 ， 有 时 我 们 想 知 道 ， 茶 个 小 朋友 ， 比 如 麦 呢 是 否 是 班 里 的 
小 朋友 ， 老 师 会 告诉 我 说 ， 不 是 ， 妥 名 在 春田 佬 化 幼儿 园 里 ， 不 在 我 
们 幼儿 园 。 这 种 查找 某 个 元 聚 是 否 存 在 的 操作 很 常用。 


而 后 有 家 长 问 老 师 ， 班 里 现在 到 底 有 多 少 个 小 朋友 呀 ， 这 种 获得 线性 
表 长 度 的 问题 也 很 普遍 。 


显然 ， 对 于 一 个 幼儿 园 来 说 ， 加 入 一 个 新 的 小 朋友 到 队列 中 ， 或 因 某 
个 小 朋友 生病 ， 需 要 移 除 某 个 位 置 ， 都 是 很 正 第 的 情况 。 对 于 一 个 线 


性 表 来 说 ， 插 入 数据 和 删除 数据 者 是 必须 的 操作 。 
所 以 ,线性 表 的 抽象 数据 类 型 定义 如 下 : 


ADT 线性 表 ( List) 


线性 表 的 数据 对 象 集合 为 {a 1 ，a 2 ，...... ，a n }， 每 个 元 素 的 类 型 均 为 DataType。 


其 中 ， 除 第 一 个 元 素 a 1 外 ， 每 一 个 元 素 有 且 只 有 一 个 直接 前 驱 元 素 ， 


除了 最 后 一 个 元 素 a ῃ 外， 每 一 个 元 素 有 且 只 有 一 个 直接 后 继 元 素 。 


数据 元 素 之 间 的 关系 是 一 对 一 的 关系 。 


Operation 
InitList(*L): 初始 化 操作 ， 建 立 一 个 空 的 线性 表 L。 
ListEmpty(L): 车 线性 表 为 空 ， 返 回 true， 否 则 返回 false 。 
ClearList(*L): 将 线性 表 清 空 。 
GetElem(L, i, *e): 将 线性 表 L 中 的 第 i 个 位 置 元 素 值 返回 给 e 
LocateElem(L, e): 在 线性 表 L 中 查找 与 给 定 值 e 相 等 的 元 素 ， 


如 果 查 找 成 功 ， 返 回 该 元 素 在 表 中 序号 表示 成 功 ; 


仔细 分 析 一 下 这 个 操作 ， 发 现 我 们 只 要 循环 集合 B 中 的 每 个 元 隶 ， 判 断 
n 百 存 在 A 中 ， 硅 不 存在 ， 则 插入 到 A 中 即 可 。 思 路 应 该 是 很 
答 /DA Ι Ην 5 


/* 将 所 有 的 在 线性 表 Lb 中 但 不 在 La 中 的 数据 元 素 插入 到 La 中 3/ 


void unionL(List *La, List Lb) 


int La_len, Lb_len, i; 


/* 声明 与 La 和 Lb 相 同 的 数据 元 素 e */ 


ElemType e; 


/* 求 线性 表 的 长 度 */ 


La_len = ListLength(*La); 


Lb_len = ListLength(Lb); 
ποια της eee Πρ) 
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/* 取 Lb 中 第 i 个 数据 元 素 赋 给 @ */ 


GetElem(Lb, i, &e); 


/* La 中 不 存在 和 e 相 同 数据 元 素 */ 


if (!LocateElem(*La, e)) 


LE ey 


ListInsert(La, ++La_len, e); 
} 


这 里 ， 我 们 对 于 union 操 作 ， 用 到 了 前 面 线 性 表 基 本 操作 ListLength、 
GetElem、LocateElem、ListInsert 等 ， 可 刚 ， 对 于 复杂 的 个 性 化 的 操 
作 ， 其 实职 是 把 基本 操作 组 合 起 来 实现 的 。 


注意 一 个 很 容易 混淆 的 地 方 ， 当 你 传递 一 个 参数 给 函数 的 时 候 ， 这 个 
参数 会 不 会 在 函数 内 被 改动 决定 了 使 用 什么 参数 形式 。 如 果 需 要 被 改 
动 ， 则 需要 传递 指向 这 个 参数 的 指针 ， 如 果 不 用 被 改动 ， 可 以 直接 传 
递 这 个 参数 。 

34 ”线性 表 的 顺序 存储 结构 

3.4.1 顺序 存储 定义 


说 这 么 多 的 线性 表 ， 我 们 来 看 看 线性 表 的 两 种 物理 结构 的 第 一 种 一 一 
顺序 存储 结构 。 


线性 表 的 顺序 存储 结构 ， 指 的 是 用 一 段 地 址 连续 的 存储 单元 依次 存储 
线性 表 的 数据 元 素 。 


线性 表 (a1,a,，,.……,an) 的 顺序 存储 示意 图 如 下 : 


图 3-4-1 
我 们 在 第 一 课时 已 经 讲 过 顺序 存储 结构 。 今 天 我 再 举 一 个 例子 。 


记得 大 学 时 ， 我 们 同 答 舍 有 一 个 同学 ， 人 特别 老实 、 热 心 ， 我 们 时 营 
会 让 他 帮 我 们 去 图 书馆 占 座 ， 他 总 是 答应 ， 你 想 想 ， 我 们 一 个 宿舍 连 
他 共有 九 个 人 ， 这 其 实 明 氛 看 十 欺负 人 的 事 。 他 每 次 一 乃 完 早饭 束 冲 
去 图 书 饮 ， 挑 一 个 好 地 儿 ， 把 他 书包 里 的 书 ， 一 本 一 本 地 按 座位 放 
好 ， 奉 书包 里 的 书 不 够 ， 他 会 把 他 的 饭 金 、 水 杯 、 水 笔 都 用 上 ， 长 长 
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图 3-4-2 
3.4.2 顺序 存储 方式 


线性 表 的 顺序 存储 结构 ， 说 白 了 ， 和 刚才 的 例子 一 样 ， 束 是 在 内 存 中 
找 了 块 地 儿 ， 通 过 占 位 的 形式 ， 把 一 定 内 存 空间 给 占 了 ， 然 后 把 相同 
数据 类 型 的 数据 元 素 依 次 存放 在 这 块 空 地 中 。 有 既然 线性 表 的 每 个 数据 
元 素 的 类 型 都 相同 ， 所 以 可 以 用 C 语 言 (其 他 语言 也 相同 ) 的 一 维 数组 
来 实现 顺序 存储 结构 ， 即 把 第 一 个 数据 元 素 存 到 数组 下 标 为 0 的 位 置 

中 ， 接 着 把 线性 表 相 邻 的 元 素 存储 在 数组 中 相 邻 的 位 置 。 


我 那 同学 占 座 时 ， 如 果 图 书馆 里 空 座 很 多 ， 他 当然 不 必 一 定 要 选择 第 
一 排 第 一 个 位 子 ， 而 是 可 以 选择 风水 不 错 、 美 女 较 多 的 地 儿 。 找 到 

后 ， 放 一 个 书包 在 第 一 个 位 置 ， 殊 表示 从 这 开始 ， 这 地 方 暂时 归 我 

了 。 为 了 建立 一 个 线性 表 ， 要 在 内 存 中 找 一 块 地 ， 于 是 这 块 地 的 第 一 
个 位 置 束 非常 关键 ， 它 是 存储 空间 的 起 始 位 置 。 


接着 ， 因 为 我 们 一 共 九 个 人 ， 所 以 他 需要 占 九 个 座 。 线 性 表 中 ， 我 们 
估算 这 个 线性 表 的 最 大 存储 容量 ， 建 立 一 个 数组 ， 数 组 的 长 度 就 是 这 
个 最 大 存储 容量 。 


可 现实 中 ， 我 们 和 宿舍 总 有 那么 儿 个 不 是 很 好 学 的 人 ， 为 了 游戏 ， 为 了 
恋爱 ， 束 不 去 图 书 饮 目 习 了 。 假 设 我 们 九 个 人 ， 去 了 六 个 ， 真 正 补 使 
用 的 座位 也 整 只 是 六 个 ， 男 三 个 是 空 的 。 同 样 的 ， 我 们 已 经 有 了 起 始 
的 位 置 ， 也 有 了 最 大 的 容量 ， 于 是 我 们 可 以 在 里 面 增加 数据 了 。 随 着 
数据 的 插入 ， 我 们 线性 表 的 长 度 开始 变 大 ， 不 过 线性 表 的 当前 长 度 不 
能 超过 存储 容量 ， 即 数组 的 长 度 。 想 想 也 是 ， 如 果 我 们 有 十 个 人 ， 只 
应 了 九 个 座 ， 目 然 是 坐 不 下 的 。 


来 看 线性 表 的 顺序 存储 的 结构 代码 。 


/* 存储 空间 初始 分 配 量 */ 


#define MAXSIZE 20 


/* ElemType 类 型 根据 实际 情况 而 定 ， 这 里 假设 为 int */ 
typedef int ElemType; 


typedef struct 


/* 数组 存储 数据 元 素 ， 最 大 值 为 MAXSIZE */ 


ElemType data[MAXSIZE]; 


/* 线性 表 当 前 长 度 */ 


int length; 


ὃν οσο: 


这 里 ， 我 们 就 发 现 描述 顺序 存储 结构 需要 三 个 属性 : 
E i pe eee a 


Ve ο 
线性 表 的 最 大 存储 容量 : 数组 长 度 MaxSize 5 
线性 表 的 当前 长 度 : length 。 


3.4.3 ”数组 长 度 与 线性 表 长 度 区 别 
ο ο κ μμ 


数组 的 长 度 是 存放 线性 表 的 存储 空间 的 长 度 ， 存 储 分 配 后 这 个 量 一 般 
征 不 变 的 。 有 个 别 同学 可 能 会 本， 数组 的 大 小 一 定 不 可 以 要 蚂 ? RE 
么 看 到 有 书 中 谈 到 可 以 动态 分 配 的 一 维 数组 。 是 的 ， 一 般 高 级 语言 ， 
比如 C、VB、C++ 都 可 以 用 编程 手段 实现 动态 分 配 数 组 ， 不 过 这 会 市 来 
性 能 上 的 损耗 。 


线性 表 的 长 度 是 线性 表 中 数据 元 素 的 个 数 ， 随 着 线性 表 插 入 和 删除 操 
作 的 进行 ， 这 个 量 是 变化 的 。 

在 任意 时 刻 ， 线 性 表 的 长 度 应 该 小 于 等 于 数组 的 长 度 。 

3.4.4 ”地 址 计算 方法 


由 于 我 们 数 数 都 是 从 1 开始 数 的 ， 线 性 表 的 定义 也 不 能 免 俗 ， 起 始 也 是 
1， 可 C 语 言 中 的 数组 却 是 从 0 开始 第 一 个 下 标的 ， 于 是 线性 表 的 第 i 个 
元 素 是 要 存储 在 数组 下 标 为 i-1 的 位 置 ， 即 数据 元 素 的 序号 和 存放 它 的 
数组 下 标 之 间 存 在 对 应 关系 (如 图 3-4-3 所 示 ) ° 


KERMAN Length 


mau SWEN 


数组 的 长 度 Max9jze 
图 3-4-3 


用 数组 存储 顺序 表意 味 着 要 分 配 固定 长 度 的 数组 空间 ， 由 于 线性 表 中 
Ξ. ΐΪΞ. ἘΠ 


其 实 ， 内 存 中 的 地 址 ， 就 和 图 书馆 或 电影 院 里 的 座位 一 样 ， 都 是 有 编 
号 的 。 存 储 器 中 的 每 个 存储 单元 都 有 自己 的 编号 ， 这 个 编号 称 为 地 
址 。 当 我 们 占 座 后 ， 占 座 的 第 一 个 位 置 确 定 后 ， 后 面 的 位 置 都 是 可 以 
计算 的 。 试 想 一 下 ， 我 是 班级 成 绩 第 五 名 ， 我 后 面 的 10 名 同学 成 绩 名 
次 是 多 少 昵 ?当然 是 6，7，...、15， 因 为 5+1，5+2，...，5+10。 由 于 
每 个 数据 元 素 ， 不 管 它 是 整 型 、 实 型 还 是 字符 型 ， 它 都 是 需要 占用 一 
定 的 存储 单元 空间 的 。 假 设 占 用 的 是 c 个 存储 单元 ， 那 么 线性 表 中 第 i+1 
个 数据 元 素 的 存储 位 置 和 第 i 个 数据 元 素 的 存储 位 置 满足 下 列 关 系 
(LOC 表 示 获 得 存储 位 置 的 函数 ) 5 


LOC(a 111 )=LOC(a 1 )+c 


所 以 对 于 第 i 个 数据 元 素 ai 的 存储 位 置 可 以 由 al 推算 得 出 : 


Cts = oe (Cee CED 


从 图 3-4-4 来 理解 : 


下 标 0 | i2 i [-] 
图 3-4-4 


通过 这 个 公式 ， 你 可 以 随时 算出 线性 表 中 任意 位 置 的 地 址 ， 不 管 它 是 
第 一 个 还 是 最 后 一 个 ， 都 是 相同 的 时 间 。 那 么 我 们 对 每 个 线性 表 位 置 
entre. 对 于 计算 机 来 说 都 是 相等 的 时 间 ， 也 吏 是 一 个 
常数 ， 因 此 用 我 们 算法 中 学 到 的 时 间 复 洒 度 的 概念 来 说 ， 它 的 存 取 时 
ο 能 为 O(1)。 我 们 通常 把 具有 这 一 特点 的 存储 结构 称 为 随机 存 取 结 


3.5 ”顺序 存储 结构 的 插入 与 删除 
3.5.1 ”获得 元 素 操作 


对 于 线性 表 的 顺序 存储 结构 来 说 ， 如 果 我 们 要 实现 GetElem 操 作 ， 即 将 
线性 表 L 中 的 第 i 个 位 置 元 素 值 返 问 ， 其 实 是 非 贡 简单 的 。 就 程序 而 
数组 下 标 范 围 内 ， 如 是 把 数组 第 i-1 下 标的 值 返回 即 


#define OK 1 


#define ERROR 0 


#define TRUE 1 
#define FALSE 0 


typedef int Status; 


/* Status 是 函数 的 类 型 ， 其 值 是 函数 结果 状态 代 


码 ， 如 OK 等 */ 
/* 初始 条 件 : 顺序 线性 


ListLength(L) */ 


LEF, isis 


/* 操作 结果 : 用 e 返 回 L 中 第 i 个 数据 元 素 的 值 */ 


Status GetElem(SqList L, int i, ElemType *e) 


Ñ 
ah eng th == oai < 
i > L.length) 
return ERROR; 
Ver ασε 15 
return OK; 
} 


注意 这 里 返回 值 类 型 Status 是 一 个 整 型 ， 返 回 OK 代 表 1，ERROR 代 表 
0。 之 后 代码 中 出 现 束 不 再 详 述 。 


3.5.2 ”插入 操作 


刚才 我 们 也 谈 到 ， 这 里 的 时 间 复 杂 度 为 0(1)。 我 们 现在 来 考虑 ， 如 采 
我 们 要 实现 ListIn-sert (*L,i,e) ， 即 在 线性 表 L 中 的 第 i 个 位 置 插入 新 元 
素 e， 应 该 如 何 操作 ? 


举 个 例子 ， 本 来 我 们 在 春运 时 去 闫 火车 票 ， 大 家 部 排队 排 的 好 好 的 。 
这 时 来 了 一 个 美女 ， 对 着 队伍 中 排 在 第 三 位 的 你 说 , “ΚΕ, .. 
帮忙 ， 我 家 母亲 有 病 ， 我 得 急 着 回去 看 她 ， 这 队伍 这 么 长 ， 你 可 否 

我 排 在 你 的 前 面 ? ”你 心 一 软 ， 束 同意 了 。 这 时 ， i ee 
Re 进 到 队伍 来 的 。 这 可 不 得 了 ， 后 面 的 人 像 蠕 虫 一 样 ， 
部 都 得 退 一 步 。 驾 声 四 起 。 但 后 面 的 人 也 不 清楚 这 加 赛 是 : 怎么 回 事 ， 
ΥΕΝ 9 


这 个 例子 其 实 已 经 说 明了 线性 表 的 顺序 存储 结构 ， 在 插入 数据 时 的 实 
现 过 程 (如 图 3-5-1 所 示 ) 5 


AH 


AA 
000909000 


图 3-5-1 


插入 算法 的 思路 : 


。 如 采 揪 入 位 置 不 合理 ， 抛 出 异 第 ; 
。 如 琳 线 性 表 长 度 大 于 等 于 数组 长 度 ， 则 抛 出 异常 或 动态 增加 容 


里 ; 

ο 从 最 后 一 个 元 素 开 始 同 前 过 有 历 到 第 i 个 位 置 ， 分 别 将 它们 都 癌 后 移 
动 一 个 位 置 ; 

ο 将 要 禁 入 元 系 填 入 位 置 处 ，? 表 长 加 1。 


实现 代码 如 下 : 


xt 


/* 初始 条 件 ， 顺序 线性 表 L 已 存在 ，1<i< 


ListLength(L), */ 


/* 操作 结果 : 在 L 中 第 i 个 位 置 之 前 插入 新 的 数据 元 


素 e，L 的 长 度 加 1 */ 
Status ListInsert(SqlList *L, int i, ElemType e) 


g 


int k; 


/* 顺序 线性 表 已 经 满 */ 


if (L->length == MAXSIZE) 


return ERROR; 


/* 当 i 不 在 范围 内 时 */ 


if (i < 1 [| i >L->length + 1) 


return ERROR; 


/* 若 插入 数据 位 置 不 在 表 尾 */ 


if (i <= L->length) 


{ 
/将 要 插入 位 置 后 数据 元 素 向 后 移动 一 位 */ 
for (k = L->length - 1; k >= i - 1; k--) 
L->data[k + 1] = L->data[k]; 
} 


/* ERICA 3/ 


L->data[i - 1] =e; 
L->length++; 
return OK; 


} 


ο ο ο το ο - 可 以 考虑 
iD ERROR AEA So SR, BT LAT 5 


3.5.3 ”删除 操作 


接着 刚才 的 例子 。 此 时 后 面 排队 的 人 群 意见 都 很 天， 都 说 怎么 可 以 这 
$, PETAEN, fate MT, BAS, RAE A TE ο Bt 
在 这 时 ， 远 处 跑 来 一 胖子 ， 对 着 这 美女 喊 ， 可 找到 你 了 ， 你 这 台子 ， 
还 我 钱 。 只 见 这 女子 二 话 不 说 ， 突 然 束 冲 出 了 队伍 ， 胖 子 妃 在 其 后 ， 
消失 在 人 群 中 。 哦 ， 原 来 她 是 倒卖 火车 票 的 黄牛 ， 刚 才 还 装 可 怜 。 于 
征 排 队 的 人 群 ， 又 像 蠕 虫 一 样 ， 均 同 前 移动 了 一 步 ， 台 声 渐 电 ， 队 伍 
又 恢复 了 平静 。 


这 就 是 线性 表 的 顺序 存储 结构 删除 元 素 的 过 程 (如 图 3-5-2 所 示 ) 。 


ΓΙ 
ĝ wart 


TWEE 


ΜΗ 5 


图 3-5-2 
删除 算法 的 思路 : 


2 


ο 如 果 删 除 位 置 不 合理 ， 抛 出 异常 

ο 取出 删除 元 素 ; 

ο 从 删除 元 素 位 置 开 始 遍 历 到 最 后 一 个 元 素 位 置 ， 分 别 将 它们 都 向 
前 移动 一 个 位 置 ; 

ο 表 长 减 1。 


实现 代码 如 下 : 


/* 初始 条 件 ， 顺序 线性 表 L 已 存在 ，1<i< 


ListLength(L) */ 


/* 操作 结果 :删除 L 的 第 i 个 数据 元 素 ， 


其 值 ，L 的 长 度 减 1 */ 


D, 
δεί 
0 


Status ListDelete(SqList *L, int i, ElemType *e) 


{ 


int k; 


ο μεσο δη 
if (L->length == 0) 
return ERROR; 


/* 删除 位 置 不 正确 */ 


if (i < 1 || i > L->length) 
return ERROR; 


*e = L->data[i - 1]; 


/* 如 果 删 除 不 是 最 后 位 置 */ 


if (i < L->length) 


/* 将 删除 位 置 后 继 元 素 前 移 */ 
for (k = i; k < L->length; k++) 
L->data[k - 1] = L->data[k]; 
} 
L->length--; 


return OK; 


J 


现在 我 们 来 分 析 一 下 ， 插 入 和 删除 的 时 间 复 杂 度 。 


先 来 看 最 好 的 情况 ， 如 有 果 元 素 要 插入 到 最 后 一 个 位 置 ， 或 者 删除 最 后 
一 个 元 素 ， 此 时 时 间 复 杂 度 为 0(1D)， 因 为 不 需要 移动 元 素 的 ， 就 如 同 
来 了 一 个 新 人 要 正常 排队 ， 当 然 是 排 在 最 后 ， 如 果 此 时 他 又 不 想 排 
了 ， 那 么 他 一 个 人 离开 就 好 了 ， 不 影响 任何 人 。 


最 坏 的 情况 呢 ， 如 果 元 素 要 插入 到 第 一 个 位 置 或 者 删除 第 一 个 元 素 ， 
此 时 时 间 复 杂 度 是 多 少 呢 ? 那 就 意味 着 要 移动 所 有 的 元 素 向 后 或 者 向 
前 ， 所 以 这 个 时 间 复 杂 度 为 OOnD) 5 


至 于 平均 的 情况 ， 由 于 元 素 插 入 到 第 个 位 置 ， 或 删除 第 i 个 元 素 ， 需 要 
移动 n-i 个 元 素 。 根 据 概 率 原 理 ， 每 个 位 置 插入 或 删除 元 素 的 可 能 | 
EI, ERMEE, AITAS, MAn, BITAL ° R 
RPEN ΕΣ FB] A Pe 31 ΠΠ IR SS, (α-1)/2 ° 


我 们 前 面 讨论 过 时 间 复 杂 度 的 推导 ， 可 以 得 出 ， 平 均 时 间 复 杂 度 还 是 
O(n) 5 

这 说 明 什 么 ? 线性 表 的 顺序 存储 结构 ， 在 存 、 读 数据 时 ， 不 管 是 哪个 
OL, ITS ARERR EOL); 而 插入 或 删除 时 ， 时 间 复 杂 度 都 是 OnD)。 
LULA, ECBO ATCA TARA, MES eR DY 
Fc SPR, ἘΒΙ ΕΕ Rie... 

3.5.4 ”线性 表 顺 序 存储 结构 的 优 缺 点 


线性 表 的 顺序 存储 结构 的 优 缺 点 如 图 3-5-3 所 示 。 


ἯΙ alm 


te RA 


μα Μο 
ASHRAM Μα 
EREM ERRERIK 
,可 以 快速 地 存 到 表 中 任 时， 难以 确定 存储 空间 
一 位 置 的 元 素 的 容量 
ERRIN RH 


图 3-5-3 

好 了 ， 大 家 休息 一 下 ， 我 们 等 会 儿 接 着 讲 男 一 个 存储 结构 。 

3.6 ”线性 表 的 链 式 存储 结构 

3.6.1 顺序 存储 结构 不 足 的 解决 办 法 

前 面 我 们 讲 的 线性 表 的 顺序 存储 结构 。 它 是 有 缺点 的 ， 最 大 的 缺点 就 


是 插入 和 删除 时 需要 移动 大 量 元 素 ， 这 显然 就 需要 耗费 时 间 。 能 不 能 
想 办 法 解决 呢 ? 


BRST lal, RBS rE FSBO TAA A 5 


为 什么 当 插 入 和 删除 时 ， 束 要 移 动 大 量 元 素 ， 仔 细 分 析 后 ， 发 现 原因 
束 在 于 相 邻 两 元 承 的 存储 位 置 也 具有 邻居 关系。 它们 编号 是 1，2， 
3，.…，Dn， 它 们 在 内 存 中 的 位 置 也 是 挨 着 的 ， 中 间 没 有 空 除 ， 当 然 就 
无 法 快速 介入 ， 而 删除 后 ， 当 中 就 会 留 出 空 阶 ， 目 然 需 要 弥补 。 问 题 
束 出 在 这 里 。 


A 同学 思路 : 让 当中 每 个 元 素 之 间 都 留 有 一 个 空位 置 ， 这 样 要 插入 时 ， 
下 不 至 于 移动 。 可 一 个 空位 置 如 何 解 决 多 个 相同 位 置 插 入 数据 的 问题 
WE? 所 以 这 个 想法 显然 不 行 。 


B 同 学 思路 : 那 惑 让 当中 每 个 元 素 之 间 都 留 足够 多 的 位 置 ， 根 据 实 际 情 
况 制 定 空 除 大 小 ， 比 如 10 个 ， 这 样 插入 时 ， 就 不 需要 移动 了 。 万 一 10 
个 空位 用 完了 ， 青 考虑 移动 使 得 每 个 位 置 之 间 都 有 10 个 空位 置 。 如 来 
删除 ， 束 直接 删 控 ， 把 位 置 留 空 肥 可 。 这 样 似乎 暂时 解决 了 插入 和 删 
除 的 移动 数据 问题 。 可 这 对 于 超过 10 个 同位 置 数据 的 插入 ， 效 率 上 还 
古 存在 问题 。 对 于 数据 的 过 历 ， 也 会 因为 空位 置 太 多 而 造成 判断 时 间 
上 的 浪费 。 而 且 显 然 这 里 空间 复杂 度 还 增加 了 ， 因 为 每 个 元 素 之 间 都 
有 阁 干 个 空位 置 。 


C 同 学 思路 : 我 们 反正 也 是 要 让 相 邻 元 素 间 留 有 足够 余地 ， 那 干脆 所 有 
的 元 素 都 不 要 考虑 相 邻 位 置 了 ， 哪 有 至 位 惑 到 哪里 ， 而 只 是 让 每 个 元 
素 知道 它 下 一 个 元 杂 的 位 置 在 哪里 ， 这 样 ， 我 们 可 以 在 第 一 个 元 素 
时 ， 就 知道 第 二 个 元 素 的 位 置 《内 存 地 址 ) ， 而 找到 它 ， 在 第 二 个 元 
素 时 ， 再 找到 第 三 个 元 素 的 位 置 〈 内 存 地 址 ) 。 这 样 所 有 的 元 素 我 们 
束 都 可 以 通过 过 有 历 而 找到 o 


好 ! 太 棒 了 ， 这 个 想法 非常 好 ! CHS, (eel Teele FLA, DA, 
ο ο ο ο σος 


3.6.2 ”线性 表 链 式 存储 结构 定义 


在 解释 这 个 思路 之 前 ， 我 们 先 来 谈 男 一 个 话题 。 前 几 年 ， 有 一 本 书 风 
靡 了 全 世界 ， 它 叫 《 达 : 芬 奇 密码 》， 成 为 世界 上 最 畅销 的 小 说 之 一 ， 
书 的 内 容 集合 了 侦探 、 惊 悚 和 阴谋 论 等 多 种 风格 ， 很 好 看 。 
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绝 大 部 分 侦探 小 说 一 样 ， 都 是 同一 种 处 理 办 法 。 那 就是 ， 作 者 不 会 让 
你 事先 知道 整个 过 程 的 全 部 ， 而 是 在 一 步 一 步 地 到 达 某 个 环节 ， 才 根 
据 现 场 的 信息 ， 获 得 或 推 呆 出 下 一 步 是 什么 ， 也 融 是 疯 ， 每 一 步 除了 
对 侦破 的 信息 进一步 确认 外 〈 之 前 信息 也 不 一 定 都 是 对 的 ， 有 时 就 是 
证 明 某 个 信息 不 正确 ) ， 还 有 就 是 对 下 一 步 如 何 操作 或 行动 的 指引 。 


不 过 ， 这 个 例子 也 不 完全 与 线性 表 相 符合 。 因 为 案件 侦破 的 线索 可 能 
是 错综复杂 的 ， 有 点 像 我 们 之 后 要 讲 到 的 树 和 图 的 数据 结构 。 今 天 我 
们 要 谈 的 是 单线 索 ， 无 分 文 的 情况 。 即 线性 表 的 链 式 存储 结构 。 


图 3-6-1 


线性 表 的 链 式 存储 结构 的 特点 是 用 一 组 任意 的 存储 单元 存储 线性 表 的 
数据 元 素 ， 这 组 存储 单元 可 以 是 连续 的 ， 也 可 以 是 不 连续 的 。 这 就 意 
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现在 链 式 结构 中 ， 除 了 要 存 数据 元 素 信 息 外 ， 还 要 存储 它 的 后 继 元 素 
的 存储 地 址 。 


因此 ， 为 了 表示 每 个 数据 元 系 a 

i 与 其 直接 后 继 数据 元 素 a 

i+1 之 间 的 逻辑 关系 ， 对 数据 元 聚 a 

i 来 说 ， 除 了 存储 其 本 身 的 信息 之 外 ， 还 需 存储 一 个 指示 其 直接 后 继 的 
信息 〈 即 直接 后 继 的 存储 位 置 ) 。 我 们 把 存储 数据 元 素 信 息 的 域 称 为 
数据 域 ， 把 存储 直接 后 继 位 置 的 域 称 为 指针 域 。 指 针 域 中 存储 的 信息 


称 做 指针 或 链 。 这 两 部 分 信息 组 成 数据 元 素 a; 的 存储 映像 ， 称 为 结 点 
(Node) ° 


n 个 结 点 (ai 的 存储 映像 ) 链 结 成 一 个 链表 ， 即 为 线性 表 (ai ,ay .an 
) 的 链 式 存储 结构 ， 因 为 此 链表 的 每 个 结 点 中 只 包含 一 个 指针 域 ， 所 
以 叫做 单 链表 。 单 链表 正 是 通过 每 个 结 点 的 指针 域 将 线性 表 的 数据 元 
素 按 其 逻辑 次 序 链接 在 一 起 ， 如 图 3-6-2 所 示 « 


3-6-2 


对 于 线性 表 来 疯 ， 总 得 有 个 头 有 个 尾 ， 链 表 也 不 例外 。 我 们 把 链表 中 
第 一 个 结 扣 的 存储 位 置 叫做 头 指 针 ， 那 么 整个 链表 的 存 取 就 必须 是 从 
头 指针 开始 进行 了 。 之 后 的 每 一 个 结 点 ， 其 实 就 是 上 一 个 的 后 继 指针 
指向 的 位 置 。 想 象 一 下 ， 最 后 一 个 结 点 ， 它 的 指针 指向 哪里 ? 


最 后 一 个 ， 当 然 就 意味 着 直接 后 继 不 存在 了 ， 所 以 我 们 规定 ， 线 性 链 
( 通 肖 用 NULL 或 “人 "符号 表示 ， 如 图 3-6- 
SATAN) 5 
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图 3-6-3 


有 时 ， 我 们 为 了 更 加 方便 地 对 链表 进行 操作 ， 会 在 单 链表 的 第 一 个 结 
点 前 附设 一 个 结 点 ， 称 为 头 结 点 。 头 结 点 的 数据 若 可 以 不 存储 任何 信 
轧 ， 谁 叫 它 是 第 一 个 昵 ， 有 这 个 特权 。 也 可 以 存储 如 线性 表 的 长 度 等 
附加 信息 ， 头 结 扣 的 指针 域 存储 指向 第 一 个 结 扩 的 指针 ， 如 图 3-6-4 所 
ZR 5 
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3.6.3” 头 指针 与 头 结 点 的 异同 


图 3-6-4 


头 指针 与 头 结 点 的 异同 号， 如 图 3-6-5 所 示 。 


' 头 指针 是 指 链 表 指 加 第 一 个 结 。 头 结 点 是 为 了 操作 的 统一 和 方 
ΜΗ, ARH aA, 便 而 设立 的 ， 放 在 第 一 元 素 的 
则 是 指 回 头 结 点 的 指针 结 所 之前， 其 数据 域 一 般 无 总 
ο Ια A ο ο 
用 头 指针 冠 以 链表 的 名 字 HTAA MER- TAH 
'ἘΜΕΕΕΛΗΣ, IH TRG a ΛΜ AR 
TAS, η. FRSC ΒΙΟΙ 
TŽ =a, 
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图 3-6-5 
3.6.4 ”线性 表 链 式 存储 结构 代码 描述 


i UEFA ZRF, ΠΣΕ FSET 28”, ἩΠ3-6-6Ρτ7ν 5 
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图 3-6-6 


这 里 我 们 大 概 地 用 图 示 表 达 了 内 存 中 单 链表 的 存储 状态 。 看 着 满 图 的 
省 略 号 “..……..”， 你 就 知道 是 多 人 么 不 方便 。 而 我 们 真正 关心 的 : 它 是 在 
内 存 中 的 实际 位 置 吗 ? 不 是 的 ， 这 只 是 它 所 表示 的 线性 表 中 的 数据 元 
素 及 数据 元 素 之 间 的 逻辑 关系 。 所 以 我 们 改 用 更 方便 的 存储 示意 图 来 
表示 单 链表 ， 如 图 3-6-7 所 示 。 
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图 3-6-7 
若 囊 有 头 结 点 的 单 链 表 ， 则 如 图 3-6-8 所 示 。 
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空 链 表 如 图 3-6-9 所 示 。 
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图 3-6-9 
单 链 表 中 ， 我 们 在 C 语 言 中 可 用 结构 指针 来 描述 。 


/* 线性 表 的 单 链 表 存 储 结 构 */ 


typedef struct Node 


τ 
ElemType data; 
struct Node *next; 
} Node; 
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typedef struct Node *LinkList; 


MANEAR, TEA, A CR AAN 
存放 后 继 结 点 地 址 的 指针 域 组 成 。 假 设 p 是 指向 线性 表 第 i 个 元 素 的 指 
秆 ， 则 该 结 点 &i 的 数据 域 我 们 可 以 用 p->data 来 表示 ，p->data 的 值 是 一 个 
数据 元 素 ， 结 点 ai 的 指针 域 可 以 用 p->next 来 表示 ，p->next 的 值 是 一 个 
指针 。p->next 指 向 谁 呢 ?当然 是 指 疝 第 it1 个 元 素 ， 即 指 疝 aj,i 的 指 

针 。 也 就 是 说 ， 如 果 p->data=a; ， 那 么 p->next->data=aij;; (如 图 3-6-10 
所 未 》 » 


p p->next 


图 3-6-10 

3.7 单 链表 的 读 取 

在 线性 表 的 顺序 存储 结构 中 ， 我 们 要 计算 任意 一 个 元 素 的 存储 位 置 是 
很 容易 的 。 但 在 单 链 表 中 ， 由 于 第 i 个 元 素 到 底 在 哪 ? 没 办 法 一 开始 就 
知道 ， 必 须 得 从 头 开 始 找 。 因 此 ， 对 于 单 链表 实现 获取 第 i 个 元 素 的 数 
据 的 操作 GetElem， 在 算法 上 ， 相 对 要 厅 烦 一 些 。 

获得 链表 第 个 数据 的 算法 思路 : 


1. 声 明 一 个 指针 p 指 癌 链表 第 一 个 结 点 ， 初 始 化 从 1 开始 ; 


a 束 瑶 历 链表 ， 让 p 的 指针 同 后 移动 ， 不 断 指 辣 下 一 结 点 ，j 款 
1; 


3. 帮 到 链 表 末尾 p 为 至 ， 则 说 明 第 i 个 结 点 不 存在 ; 
4. 否 则 查找 成 功 ， 返 回 结 点 p 的 数据 。 
实现 代码 算法 如 下 : 


/* 初始 条 件 ， 顺序 线性 表 L 已 存在 ，1<i< 


ListLength(L) */ 


/* 操作 结果 : 用 e 返 回 L 中 第 i 个 数据 元 素 的 值 */ 


Status GetElem(LinkList L, int i, ElemType *e) 


κ 
πε a 
LinkList p; /* 声明 一 指针 p */ 
p = L->next; /* 让 p 指 向 链表 L 的 第 个 结 点 */ 
ρα ας /* j 为 计数 器 */ 
/* p 不 为 空 且 计数 器 j 还 没有 等 于 i 时 ， 循 环 继续 */ 


while (p ee 1 < i) 


{ 
p = p->next; ΜΕΡΕΣ Ρε πα 
Ei 
3 
a leslie es) 
return ERROR; /* 第 i 个 结 点 不 存在 */ 
eta /* 取 第 i 个 结 点 的 数据 */ 
return ΟΚ; 


说 白 了 ， 就 是 从 头 开始 找 ， 直 到 第 i 个 结 点 为 止 。 由 于 这 个 算法 的 时 间 
复杂 度 取决 于 i 的 位 置 ， 当 i=1 时 ， 则 不 需 遍 历 ， 第 一 个 就 取出 数据 了 ， 
而 当 i=n 时 则 遍历 n-1 次 才 可 以 。 因 此 最 坏 情况 的 时 间 复 杂 度 是 O(n)。 


由 于 单 链 表 的 结构 中 没有 定义 表 长 ， 所 以 不 能 事先 知道 要 循环 多 少 
次 ， 因 此 也 束 不 方便 使 用 for 来 控制 循环 。 其 主要 核心 思想 就 古 “ 工 作 指 
针 后 移 "， 这 其 实 也 是 很 多 算法 的 钊 用 技术 。 


ο ο ο ΜΗ 
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哈 ， 世 间 万 物 总 是 两 面 的 ， 有 好 自然 有 不 足 ， 有 差 自然 就 有 优势 。 下 
面 我 们 来 看 一 下 在 单 链表 中 的 如 何 实现 < 插入 * 和 "删除 ” 。 


3.8 单 链 表 的 播 入 与 删除 
3.8.1 单 链 表 的 插入 
先 来 看 单 链表 的 插入 。 假 设 存储 元 素 e 的 结 点 为 s， 要 实现 结 点 p、p- 


>next 和 s 之 间 逻 辑 关 系 的 变化 ， 只 需 将 结 点 s 揪 入 到 结 点 p 和 p->next 之 间 
即 可 。 可 如 何 插入 呢 (如 图 3-8-1 所 示 ) ? 


图 3-8-1 


根本 用 不 着 惊动 其 他 结 点 ， 只 需要 让 s->next 和 p->next 的 指针 做 一 点 改 
变 即 可 。 


s->next = p->next; p->next = 5; 
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点 s 变 成 p 的 后 继 结 点 (如 图 3-8-2 所 示 ) ° 


p p->next 


图 3-8-2 
考虑 一 下 ， 这 两 句 的 顺序 可 不 可 以 交换 ? 


如 有 果 先 p->next=s; 再 s->next=p->next; 会 怎么 样 ? 哈哈 ， 因 为 此 时 第 一 名 
会 使 得 将 p->next 给 窗 盖 成 的 地 址 了 。 那 么 s->next=p->next， 其 实 就 等 
于 s->next=s， 这 样 真正 的 拥有 a 


计 1 数 据 元 素 的 结 点 束 没 了 上 级 。 这 样 的 插入 操作 吏 是 失败 的 ， 造 成 了 
Δι 。 所 以 这 两 句 生 无论 如 何不 能 反 的 ， 这 点 初学 
一 定 要 注意 。 


插入 结 点 s 后 ， 链 表 如 图 3-8-3 所 示 。 


p s->next 
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图 3-8-3 
对 于 单 链表 的 表 头 和 表 尾 的 特殊 情况 ， 操 作 是 相同 的 ， 如 图 3-8-4 所 
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图 3-8-4 


单 链表 第 i 个 数据 插入 结 点 的 算法 思路 : 1. 声 明 一 指针 p 指 向 链表 头 结 
点 ， 初 始 化 j 从 1 开始 ; 2. 当 j<i 时 ， 束 遍历 链表 ， 让 p 的 指针 加 后 移动 ， 
不 断 指向 下 一 结 点 ，j 标 加 1;， 3. 者 到 链表 末尾 p 为 空 ， 则 说 明 第 ji 个 结 点 
不 存在 ; 4. 否 则 查找 成 功 ， 在 系统 中 生成 一 个 空 结 点 s; 5. 将 数据 元 素 e 
赋值 给 s->data; 6. 单 链表 的 插入 标准 语句 S->next=p->next;p->next=S; 
7. 返 回 成 功 。 


实现 代码 算法 如 下 : 


/* 初始 条 件 ， 顺 序 线性 


LL 已 存在 ，1<i< 


ListLength(L), */ 


/* 操作 结果 : 在 L 中 第 i 个 结 点 位 置 之 前 插入 新 的 数 
据 元 素 e, LL 的 长 度 加 1 */ 


Status ListInsert(LinkList *L, int i, ElemType e) 
i 

Inka 

EinkGastep ies: 

p= *L; 


j= 1; 
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while (p && j < i) 


p = p->next; 
ἘΠΙΣ 
J} 


/* 第 i 个 结 点 不 存在 */ 


if (!p |] 1 > 4) 


return ERROR; 


/* 生成 新 结 点 〈C 标 准 画 数 ) */ 


s = (LinkList)malloc(sizeof(Node)); 
s->data = e; 

/* 将 p 的 后 继 结 点 赋值 给 s 的 后 继 */ 
s->next = p->next; 

/* 将 s 赋 值 给 p 的 后 继 */ 

p->next = 5; 


return OK; 


在 这 上 段 算 法 代码 中 ， 我 们 用 到 了 C 语 言 的 mal-loc 标 准 钞 数 ， 它 的 作用 整 
是 生成 一 个 新 的 结 点 ， 其 类 型 与 Node 是 一 样 的 ， 其 实质 就 是 在 内 存 中 
找 了 一 小 块 宅 地 ， 准 备用 来 存放 数据 e 的 s 结 点 。 

3.8.2 单 链表 的 删除 

现在 我 们 再 来 看 蛙 链 表 的 删除 。 设 存储 元 素 a 


i 的 结 态 为 9， 要 实现 将 结 点 q 删 除 单 链表 的 操作 ， 其 实 束 是 将 它 的 击 继 
结 点 的 指针 绕 过 ， 指 向 它 的 后 继 结 点 即 可 ， 如 图 3-8-5 所 示 。 
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图 3-8-5 
我 们 所 要 做 的 ， 实 际 上 就 是 一 步 ，p->next=p->next->next， 用 q 来 取代 p- 


>next, BNE: 


q=p->next; p->next=q->next; 


解读 这 两 句 代 码 ， 世 就 是 说 把 p 的 后 继 结 点 改 成 p 的 后 继 的 后 继 结 点 。 
有 点 擂 口 呀 ， 那 我 再 打 个 形象 的 比方 。 本 来 是 爸爸 左手 牵 着 妈妈 的 

手 ， 右 手 牵 着 军 宝 的 手 在 马路 边 散 步 。 突 然 迎 面 走 来 一 美女 ， 沟 爸 一 
下 子 看 采 了 ， 此 情景 被 妈妈 逮 个 正 着 ， 于 是 她 生气 地 甩 开 牵 着 的 爸爸 
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妈妈 是 p 结 点 ， 妈 妈 的 后 继 是 爸爸 p->next， 也 可 以 叫 q 结 点 ， 妈 妈 的 后 
继 的 后 继 是 儿子 p->next->next， 即 q->next。 当 妈妈 去 率 儿 子 的 手 时 ， 这 
个 爸爸 残 已 经 与 母子 俩 没有 率 手 联系 了 ， 如 图 3-8-6 所 示 。 
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— 一 一 一 


图 3-8-6 

单 链 表 第 i 个 数据 删除 结 点 的 算法 思路 : 

1. 声 明 一 指针 p 指 向 链表 头 结 点 ， 初 始 化 j 从 1 开始 ; 

2. 当 j<iH 时 ， 就 遍历 链表 ， 让 p 的 指针 向 后 移动 ， 不 断 指向 下 一 个 结 点 ，j 
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3. 各 到 链表 末尾 p 为 空 ， 则 说 明 第 i 个 结 点 不 存在 ; 
4. 人 否则 碍 找 成 功 ， 将 欲 删除 的 结 点 p->next 赋 值 给 q; 
5. 单 链表 的 删除 标准 语句 p->next=q->next; 

6. 将 q 结 点 中 的 数据 赋值 给 e， 作 为 返回 ; 

7. 释 放 q 结 点 ; 


8. 返 回 成 功 。 


实现 代码 算法 如 下 : 


/* 初始 条 件 ， 顺 序 线性 


ListLength(L) */ 


ειπα, isis 


/* 操作 结果 : 删除 [的 第 i 个 结 点 ， 并 用 e 返 回 大 


值 ，L 的 长 度 减 1 */ 


Status ListDelete(LinkList *L, int i, ElemType *e) 
a 

Ine Ἴ] 0 

ink ist a; 

p= *L; 


j= 1; 


/* 遍历 寻找 第 -1 个 结 点 */ 


while (p->next && j < i) 


/* 第 i 个 结 点 不 存在 */ 


ΠΠ (next Me e πὸ) 
return ERROR; 

q = p->next; 

/* 将 q 的 后 继 赋值 给 p 的 后 继 */ 


p->next = q->next; 


/* 将 q 结 点 中 的 数据 给 e */ 


*e = q->data; 


/* 让 系统 回收 此 结 点 ， 释 放 内 存 */ 


free(q); 


return OK; 


这 段 算法 代码 里 ， 我 们 又 用 到 了 另 一 个 C 语 言 的 标准 画 数 free 。 它 的 作 
用 就 是 让 系统 回收 一 个 Node 结 点 ， 释 放 内 存 。 


分 析 一 下 刚才 我 们 讲解 的 单 链表 插入 和 删除 算法 ， 我 们 发 现 ， 它 们 其 
实 都 是 由 两 部 分 组 成 : 第 一 部 分 就 是 般 历 查找 第 i 个 结 点 ， 第 二 部 分 就 
征 插 入 和 删除 结 点 。 


从 整个 算法 来 说 ， 我 们 很 容易 推导 出 ， 它 们 的 时 间 复 杂 度 都 是 O(n)。 
如 朱 在 我 们 不 知道 第 i 个 结 点 的 指针 位 置 ， 单 链表 数据 结构 在 插入 和 删 
除 操作 上 ， 与 线性 表 的 顺序 存储 结构 是 没有 太 大 优势 的 。 但 如 果 ， 我 
们 希望 从 第 i 个 位 置 ， 插 入 10 个 结 点 ， 对 于 顺序 存储 结构 意味 着 ， 每 一 
次 搬入 都 需要 移动 n-i 个 结 点 ， 每 次 都 是 O(n)。 而 单 链表 ， 我 们 只 需要 
在 第 一 次 时 ， 找 到 第 i 个 位 置 的 指针 ， 此 时 为 O(n)， 接 下 来 只 古人 简单 地 
通过 赋值 移动 指针 而 已 ， 时 间 复 杂 度 都 是 O(1)。 显 然 ， 对 于 插入 或 删 
除数 据 越 频 烷 的 操作 ， 单 链表 的 效率 优势 束 越 是 明显 。 

3.9 单 链 表 的 整 表 创 建 

回顾 一 下 ， 顺 序 存储 结构 的 创建 ， 其 实 就 是 一 个 数组 的 初始 化 ， 即 声 
明 一 个 类 型 和 大 小 的 数组 并 赋值 的 过 程 。 而 单 链 表 和 顺序 存储 结构 就 
不 一 样 ， 它 不 像 顺序 存储 结构 这 么 集中 ， 它 可 以 很 散 ， 是 一 种 动态 结 
构 。 对 于 每 个 链表 来 说 ， 它 所 占用 空间 的 大 小 和 位 置 是 不 需要 预先 分 
配 划 定 的 ， 可 以 根据 系统 的 情况 和 实际 的 需求 即时 生成 。 


所 以 创建 单 链 表 的 过 程 就 是 一 个 动态 生成 链表 的 过 程 。 即 从 “ 空 表 ”的 
初始 状态 起 ， 依 次 建立 各 元 素 结 点 ， 并 逐个 插入 链表 。 


单 链表 整 表 创建 的 算法 思路 : 
1. 声 明 一 指针 p 和 计数 器 变量 i; 
2. 初 始 化 一 空 链表 L.; 
3. 让 L 的 头 结 点 的 指针 指向 NULL， 即 建立 一 个 带头 结 点 的 单 链 表 ; 
4. 循 环 : 
« 生成 一 新 结 点 赋值 给 p; 


。 随 机 生成 一 数字 赋值 给 p 的 数据 域 p->data; 
。 将 p 插 入 到 头 结 点 与 前 一 新 结 点 之 间 。 


实现 代码 算法 如 下 : 


/* 随机 产生 n 个 元 素 的 值 ， 建 立 带 表 头 结 点 的 单 链 
线性 表 L (AIE) */ 


void CreateListHead(LinkList *L, int n) 


i 
LinkList p; 
ii el 
/* 初始 化 随机 数 种 子 */ 
srand(time(0)); 
*L = (LinkList)malloc(sizeof (Node) ); 
/* 先 建 立 一 个 带头 结 点 的 单 链表 */ 
(*L)->next = NULL; 
for (ak 0 ile ale) 
{ 
/* 生成 新 结 点 */ 
p = (LinkList)malloc(sizeof(Node)); 
/* 随机 生成 100 以 内 的 数字 */ 
p->data = rand() % 100 + 1; 
p->next = (*L)->next; 
/* HABA */ 
(*L)->next = p; 
} 
} 


这 段 算法 代码 里 ， 我 们 其 实用 的 是 插队 的 办 法 ， 束 是 始终 让 痢 结 点 在 
第 一 的 位 置 。 我 也 可 以 把 这 种 算法 位 称 为 头 搬 法 ， 如 图 3-9-1 所 示 。 


| | ->next 


关于 一 


图 3-9-1 

可 事实 上 ， 我 们 还 是 可 以 不 这 样 干 ， 为 什么 不 把 新 结 点 都 放 到 最 后 
呢 ， 这 才 是 排队 时 的 正常 思维 ， 所 谓 的 先 来 后 到 。 我 们 把 每 次 新 结 点 
都 揪 在 终端 结 点 的 后 面 ， 这 种 算法 称 之 为 尾 揪 法 。 


实现 代码 算法 如 下 : 


/* 随机 产生 n 个 元 素 的 值 ， 建 立 带 表 头 结 点 的 单 链 


线性 表 L (ΕΠΑ) */ 
void CreateListTail(LinkList *L, int n) 
ή 

μπα ο μμ 


ΠΠ aby 


/* 初始 化 随机 数 种 子 */ 


srand(time(0)); 


/* SREP RE ', 


*L = (LinkList)malloc(sizeof (Node) ); 


/* 『 为 指向 尾部 的 结 点 */ 
RE 

if; Olan (GLE — ss Oj ede en πο) 
站 


/* 生成 新 结 点 */ 


p = (Node *)malloc(sizeof(Node)); 


/* 随机 生成 100 以 内 的 数字 */ 


p->data = rand() % 100 + 1; 


/* 将 表 尾 终端 结 点 的 指针 指向 新 结 点 */ 


r->next = p; 


/* 将 当前 的 新 结 点 定义 为 表 尾 终端 结 点 */ 


ο ο 
} 


/* 表示 当前 链表 结束 */ 


r->next = NULL; 


注意 L 与 的 天 系 ，L 古 指 整 个 单 链表 ， 而 r 古 指向 尾 结 点 的 变量 ,I 会 随 
着 循环 不 断 地 变化 结 点 ， 而 L 则 是 随 着 循环 增长 为 一 个 多 结 点 的 链表 9 


这 里 需 解释 一 下 ，r>next=p; 的 意思 ， 其 实 束 是 将 刚才 的 表 尾 终端 结 点 r 
的 指针 指 交 新 结 氮 p， 如 图 3-9-2 所 示 ， 当 中 心 位 置 的 连 线 殉 是 表示 这 个 


FA ο 
AK /DA 


t->next 


μα 
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[ p [ p 


图 3-9-2 
r>next=p; 这 一 句 应 该 还 好 理解 ， 我 以 前 很 多 学 生 不 理解 的 就 是 后 面 这 
一 句 r=p; 是 什么 意思 ? 请 看 图 3-9-3 。 

next p 
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图 3-9-3 

它 的 意思 ， 就 是 本 来 r 是 在 ai ; 元 素 的 结 点 ， 可 现在 它 已 经 不 是 最 后 的 
结 点 了 ， 现 在 最 后 的 结 点 是 ai ， 所 以 应 该 要 让 将 p 结 点 这 个 最 后 的 结 点 
赋值 给 r。 此 时 r 又 是 最 终 的 尾 结 点 了 。 


循环 结束 后 ， 那 么 应 该 让 这 个 市 护 的 指针 域 曾 空 ， 因 此 有 了 “- 
>next=NULL;”， 以 便 以 后 遍历 时 可 以 确认 其 是 尾部 。 


3.10 单 链 表 的 整 表 删 除 


当 我 们 不 打算 使 用 这 个 单 链 表 时 ， 我 们 需要 把 它 销 慌 ， 其 实 也 就 是 在 
内 存 中 将 它 释 放 掉 ， 以 便于 留 出 空间 给 其 他 程序 或 软件 使 用 。 


单 链表 整 表 删除 的 算法 思路 如 下 : 
1. 声 明 一 指针 p 和 q; 


2. 将 第 一 个 结 点 赋值 给 p; 


3. 循 环 : 
oR ΕΕΒΕ ΑΒ: 
。 释放 p; 


。 将 gq 赋值 给 p。 


实现 代码 算法 如 下 : 


/* 初始 条 件 ， 顺序 线性 表 L 已 存在 ， 操 作 结 果 : 将 L 


重 置 为 空 表 */ 


Status ClearList(LinkList *L) 


a 


nkk tap ds 
/* p 指 向 第 一 个 结 点 */ 


p = (*L)->next; 


/* WERE */ 


while (p) 

i 
q = p->next; 
Fee( 
p=q; 


} 


πι 


(*L)->next = NULL; 
return OK; 


} 


这 段 算法 代码 里 ， 和 常见 的 错误 束 是 有 同学 会 觉得 q 变 量 没 有 存在 的 必 
要 。 在 循环 体内 直接 写 free(p); p = p->next; 即 可 。 可 这 样 会 市 来 什么 问 


题 ? 


要 知道 p 指 回 一 个 结 点 ， 它 除了 有 数据 域 ， 还 有 指针 域 。 你 在 做 free(p); 
时 ， 其 实 是 在 对 ο η Te ELA LAE να: 
帝 快 要 病死 了 ， 却 还 没有 册封 太子 ， 他 儿子 五 六 个 ， 你 说 要 是 你 脚 一 
足 倒 是 解脱 了 ， 这 国家 咋 办 ， 你 那 几 个 儿子 咋 办 ? 这 要 是 为 了 旦 位 ， 

什么 杂 元 第 血肉 情 都 成 了 浮云 ， 一 定 会 打 起 来 。 所 以 不 行 ， 呈 帝 不 能 
咏 上 死 ， 得 先 把 挝 嘱 写 好 ， 说 清楚 ， 哪 个 儿子 做 太 了 于 才 行 。 而 这 个 遗 
oe 十 变量 q 的 作用 ， 它 使 得 下 一 个 结 点 是 谁 得 到 了 记录 ， 以 便于 等 当 

结 点 释放 后 ， 把 下 一 παν 明日 了 吗 ? 


好 了 ， 说 了 这 么 多 ， 我 们 可 以 来 简单 总 结 一 
311 单 链表 结构 与 顺序 存储 结构 优 缺 点 
简单 地 对 单 链表 结构 和 顺序 存储 结构 做 对 比 : 


存储 分 本 万 式 


* 上 顺序 存储 结构 用 一 段 
ARE BN 
线性 表 的 数据 元 


ΕΚΑΒ ΕΑΠ 
构 ， 用 一 组 任意 的 存 全 
ΕΛΕΠΑΝΑΗπΕ 


图 3-11-1 


ἡ ἢ β΄ 
“Bi * 顺序 存 储 结 构 需要 预 分 配 
REREN) FREN, DAT, RA, 
AERON) TT ΒΑΕ ΤΑ 
«Κλ ER PRR DATA 
间 ， 只 要 有 就 可 以 分 配 

| 结 
ARAA TROTIS 

时 间 为 ln) 

* 单 链表 在 找 出 某 位 置 的 

指针 后 ， 插 入 和 删除 时 

ARAI) 


通过 上 面 的 对 比 ， 我 们 可 以 得 出 一 些 经 验 性 的 结论 : 


。 帮 线性 表 需 要 频繁 查找 ， 很 少 进行 插入 和 删除 操作 时 ， 宜 采用 顺 
序 存储 结构 。 若 需要 频繁 插入 和 删除 时 ， 宜 采用 单 链表 结构 。 比 
如 说 游戏 开发 中 ， 对 于 用 户 注 册 的 个 人 信息 ， 除 了 注册 时 插入 数 
据 外 ， 绝 大 多 数 情况 都 是 读 取 ， 所 以 应 该 考虑 用 顺序 存储 结构 。 
而 游戏 中 的 玩家 的 武器 或 者 装备 列表 ， 随 着 玩家 的 游戏 过 程 中 ， 
可 能 会 随时 增加 或 删除 ， 此 时 再 用 顺序 存储 整 不 太 合 适 了 ， 单 链 
表 结 构 束 可 以 大 展 拳 脚 。 当 然 ， 这 只 古人 简单 的 类 比 ， 现 实 中 的 软 
件 开 发 ， 要 考虑 的 问题 会 复杂 得 多 。 


。 当 线 性 表 中 的 元 素 个 数 变 化 较 大 或 者 根本 不 知道 有 多 大 时 ， 最 好 
用 单 链表 结构 ， 这 样 可 以 不 需要 考虑 存储 空间 的 大 小 问题 。 而 如 
果 事 移 知 道 线性 表 的 大 臻 长度， 比如 一 年 12 个 月 ， 一 周 就 是 星期 
一 至 星期 日 共 七 天 ， 这 种 用 顺序 存储 结构 效率 会 高 很 多 。 


总 之 ， 线 性 表 的 顺序 存储 结构 和 单 链 表 结 构 各 有 其 优 缺 点 ， 不 能 简单 
的 说 哪个 好 ， 哪 个 不 好 ， 需 要 根据 实际 情况 ， 来 综合 平衡 采用 哪 种 数 
据 结构 更 能 满足 和 达到 需求 和 性 能 ο 


休 已 一 下 ， 我 们 再 来 看 看 其 他 的 链表 结构 。 
3.12 ”静态 链表 


其 实 C 语 言 真是 好 东西 ， 它 具有 的 指针 能 力 ， 使 得 它 可 以 非常 容易 地 操 
作 内 存 中 的 地 址 和 数据 ， 这 上 比 其 他 高 级 语言 更 加 灵活 方便 。 后 来 的 面 
回 对 象 语 言 ， 如 Java、C# 等 ， 虽 不 使 用 指针 ， 但 因为 启用 了 对 象 引用 
机 制 ， 从 某 种 角度 也 间接 实现 了 指针 的 某 些 作 用 。 但 对 于 一 些 语言 ， 

如 Basic、Fortran 等 早期 的 编程 高 级 语言 ， 由 于 没有 指针 ， 链 表 结 构 按 
照 前 面 我 们 的 讲法 ， 它 就 没 法 实现 了 『。 怎 么 办 呢 ? 


有 人 束 想 出 来 用 数组 来 代替 指针 ， 来 接 述 单 链表 。 真 古 不 得 不 佩服 他 
IER, BUR a He EZ BAYT - 


首先 我 们 让 数组 的 元 素 都 是 由 两 个 数据 域 组 成 ，data 和 cur。 也 就 是 

说 ， 数 组 的 每 个 下 标 都 对 应 一 个 data 和 一 个 cur 。 数据 域 data， 用 来 存放 
数据 元 素 ， 也 就 是 通常 我 们 要 处 理 的 数据 ， 而 cur 相 当 于 单 链表 中 的 
next 指 针 ， 存 放 该 元 素 的 后 继 在 数组 中 的 下 标 ， 我 们 把 cur 叫 做 游标 。 


我 们 把 这 种 用 数组 描述 的 链表 叫做 静态 链表 ， 这 种 揪 述 方法 还 有 起 名 
叫做 游标 实现 法 。 

为 了 我 们 方便 插入 数据 ， 我 们 通常 会 把 数组 建立 得 大 一 些 ， 以 便 有 一 
些 空 内 空间 可 以 便于 搬入 时 不 至 于 淤 出 。 


/* 线性 表 的 静态 链表 存储 结构 */ 


/* 假设 链表 的 最 大 长 度 是 1000 */ 


#define MAXSIZE 1000 


typedef struct 


{ 


ElemType data; 


/* 游标 (Cursor) ， 为 6 时 表示 无 指向 */ 
"ΠΕ ου; 


} Component, 


/* 对 于 不 提供 结构 struct 的 程序 设计 语言 ， 


可 以 使 


Ἔα 


十 并 行 数组 data 和 cur 来 处 理 。 */ 


StaticLinkList [MAXSIZE]; 


男 外 我 们 对 数组 第 一 个 和 最 后 一 个 元 素 作为 符 殊 元 了 处 理 ， 不 存 数 

据 。 我 们 通 闸 把 未 被 使 用 的 数组 元 素 称 为 备用 链表 。 而 数组 第 一 个 元 
素 ， 即 下 标 为 0 的 元 素 的 cur 束 存放 备用 链表 的 第 一 个 结 点 的 下 标 ， 而 数 
组 的 最 后 一 个 元 素 的 cur 则 存放 第 一 个 有 数值 的 元 素 的 下 标 ， 相 当 于 单 
链表 中 的 头 结 点 作用 ， 当 整个 链表 为 空 时 ， 则 为 0。 如 图 3-12-1 所 示 。 


数组 第 一 个 元 未 的 cur 用 来 人 数组 最 后 一 个 元 素 的 cu 用 来 存放 第 一 
ΦΠΑ ΜΜ |} MEATY Ην, MATRAN 


图 3-12-1 
此 时 的 图 示 相 当 于 初始 化 的 数组 状态 ， 见 下 面 代码 : 


/* 将 一 维 数组 space 中 各 分 量 链 成 链表 ， */ 


/* space[90].cur 为 头 指 针 ， "9" 表示 空 指针 */ 


Status InitList(StaticLinkList space) 
te 

imt a 

fom G= To i S MAXSIZE = I IFE) 


Space[i].cur = i+ 1; 


/* 目前 静态 链表 为 空 ， 最 后 一 个 元 素 的 cur 为 9 */ 


Space[MAXSIZE - 1].cur = 0; 
return OK; 


} 


假设 我 们 oe 比如 分 别 存 放 
Bo ee eas rs `“ 庚 ”等 数据 ， 则 它 将 处 于 如 图 3-12- 
2 所 示 这 种 状态 。 


εν 
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图 3-12-2 


此 时 “ 甲 ” 这 里 就 存 有 下 一 元 素 “ 乙 ”的 游标 2，“ 乙 ” 则 存 有 下 一 元 
素 “ 丁 ”的 下 标 3。 而 * 庚 "是 最 后 一 个 有 值 元 素 ， 所 以 它 的 cur 设 置 为 0。 


而 最 后 一 个 元 聚 的 cur 则 因 * 咎 ?是 第 一 有 值 元 素 而 存 有 它 的 下 标 为 1。 而 
第 一 个 元 素 则 因 空 内 空间 的 第 一 个 元 素 下 标 为 7， 所 以 它 的 cur 存 有 7。 


3.12.1 静态 链表 的 插入 操作 
现在 我 们 来 看 看 如 何 实现 元 素 的 插入 。 


静态 链表 中 要 解决 的 古 ， 如 何 用 静态 模拟 动态 链表 结构 的 存储 空间 的 
分 配 ， 需 要 时 申请 ， 无 用 时 释放 。 


我 们 前 面 说 过 ， 在 动态 链表 中 ， 结 点 的 申请 和 释放 分 别 借用 malloc() 和 
free() 两 个 芳 数 来 实现 。 在 静态 链表 中 ， 操 作 的 古 数 组 ， 不 存在 像 动态 
链表 的 结 点 申请 和 释放 问题 ， 所 以 我 们 需要 自己 实现 这 两 个 函数 ， 才 
可 以 做 插入 和 删除 的 操作 。 


为 了 因明 数组 中 哪些 分 量 未 被 使 用 ， 解 决 的 办 法 是 将 所 有 未 被 使 用 过 
的 及 已 被 删除 的 分 量 用 游标 链 成 一 个 备用 的 链表 ， 每 当 进行 插入 时 ， 
便 可 以 从 备用 链表 上 取得 第 一 个 结 点 作为 待 插入 的 新 结 点 。 


/* 若 备用 空间 链表 非 空 ， 则 返回 分 配 的 结 点 下 标 ， 
T 


则 返回 9 */ 


int Malloc_SLL(StaticLinkList space) 
i 


/* 当前 数组 第 一 个 元 素 的 cur 存 的 值 ， */ 


/* 就 是 要 返回 的 第 一 个 备用 空闲 的 下 标 */ 


int i = space[0].cur; 


/* 由 于 要 拿 出 一 个 分 量 来 使 用 了 ， 所 以 我 们 */ 


/* PANEER PTS 做 备用 */ 


if (space[0].cur) 
space[0].cur = space[i].cur; 


return i; 


这 段 代 码 有 意思 ， 一 方面 它 的 作用 就 是 返回 一 个 下 标 值 ， 
η 空 几 的 下 标 。 从 上 面 的 图 示例 子 来 看 ， 
KPE |AI7 ο 


那么 既然 下 标 为 7 的 分 量 准备 要 使 用 了 ， 束 得 有 接替 者 ， 所 以 了 驶 把 分 量 
7 的 cur 值 赋值 给 头 元 素 ， 也 就 是 把 8 给 space[0].cur， 之 后 就 可 以 继续 分 
配 新 的 空 闪 分 量 ， 实 现 类 似 malloc0 画 数 的 作用 。 


现在 我 们 如 果 和 需要 在 “ 乙 * 和 “] "之 间 ， 揪 入 一 个 值 为 < 丙 ” 的 元 素 ， 按 照 
以 前 顺序 存储 结构 的 做 法 ， 应 该 要 把 “J”、“ 戊 ”、“ 已 ”、“ 庚 ”这 些 元 素 
都 往 后 移 一 位 。 但 目前 不 需要 ， 因 为 我 们 有 了 新 的 手段 。 


新 元 素 “ 丙 ”， 想 插队 是 吧 ? 可 以 ， 你 先 悄悄 地 在 队伍 最 后 一 排 第 7 个 游 
标 位 置 竺 着， 我 一 会 就 能 帮 你 搞定 。 我 接着 找到 了 “2”， 告诉 他 ， 你 
的 cur 不 是 游标 为 3 的 * 本 >” 了， 这 点 小 钱 ， 意 思 意 思 ， 你 把 你 的 下 一 位 的 
游标 改 为 7 就 可 以 了 。“ 乙 ”到 了 口气 ， ος 。 此 时 再 回 
到 “ 丙 ” 那 里 ， 说 你 把 你 的 cur 改 为 3。 就 这 样 ， 在 绝 大 多 数 人 都 不 知道 的 
情况 下 ， 整 个 排队 的 次 序 发 生 了 改变 (如 图 3-12-3 所 示 ) 


实现 代码 如 下 ， 代 码 左 侧 数 字 为 行 号 


/* 在 L 中 第 i 个 元 素 之 前 插入 新 的 数据 元 素 e */ 


Status ListInsert(StaticLinkList L, int i, ElemType e) 
{ 


TMG Ain és. abe 


/* 注意 k 首 先是 最 后 一 个 元 素 的 下 标 */ 


k = MAX_SIZE - 1; 
(st Eength ο) 


return ERROR; 


/* 获得 空闲 分 量 的 下 标 */ 


j = Malloc_SSL(L); 
if (3) 
£ 
/* 将 数据 赋值 给 此 分 量 的 data */ 


L[j].data = e; 


/* 找到 第 i 个 元 素 之 前 的 位 置 */ 


πο (l= 


k = L[k].cur; 


/* 把 第 i 个 元 素 之 前 的 cur 赋 值 给 新 元 素 的 cur */ 


[Elo ee πμ Ee ur, 


/* 把 新 元 素 的 下 标 赋值 给 第 i 个 元 素 之 前 元 素 的 cur */ 


Cu της 
return ΟΚ; 


} 


return ERROR; 


当 我 们 执行 揪 入 语句 时 ， 我 们 的 目的 是 要 在 * 乙 ?和 “本 ”之 间 插 

入 “两 ”。 调 用 代码 时 ， 输 入 i 值 为 3。 

第 4 行 让 k=MAX 517Ε-1-999 ° 

ο 第 7 行 ，j=Malloc_SSL(L)=7。 此 时 下 标 为 0 的 cur 也 因为 7 要 被 占用 
而 更 改 备 用 链表 的 值 为 8。 

e 第 11 一 12 行 ，for 循 环 ] 由 1 到 2， 执 行 两 次 。 代 码 k=L[k].cur; 使 得 

k=999, 得 到 k=L[999].cur=1， 再 得 到 k=L[1].cur=2 ° 

第 13 行 ，L[j].cur=L[kj.cur; 因 j=7， 而 k=2 得 到 L[7].cur=L[2].cur=3。 

这 就 是 刚才 我 说 的 让 “ 丙 ? 把 它 的 cur 改 为 3 的 意思 。 
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把 它 的 cur 改 为 指 癌 “两 ?的 下 标 7。 


束 这 样 ， 我 们 实现 了 在 数组 中 ， 实 现 不 移动 元 系 ， 却 插入 了 数据 的 操 
作 (如 图 3-12-3 所 示 ) 。 没 理解 可 能 觉得 有 些 复杂 ， 理 解 了 ， 也 就 那么 


图 3-12-3 

3.12.2 ”静态 链表 的 删除 操作 

故事 没完 ， 接 着 ， 排 在 第 一 个 的 甲 突然 接 到 一 电话 ， 看 着 很 急 ， 多 半 
不 是 家 里 有 紧急 情况 ， 就 是 单位 有 突 发 状况 ， 反 正 稍 有 犹 孙 之 后 就 急 
忽 匆 离开。 这 意味 着 第 一 位 空 出 来 了 了， 那么 自然 刚才 那个 收 了 好 处 的 
乙 就 成 了 第 一 位 一 有 人 走运 起 来 ， 喝 水 都 长 肉 。 


和 前 面 一 样 ， 删 除 元 素 时 ， 原 来 是 需要 有 释放 结 点 的 函数 free0。 现 在 我 
们 也 得 目 己 实 现 它 : 


/* 删除 在 L 中 第 i 个 数 据 元 素 e */ 


Status ListDelete(StaticLinkList L, int i) 
{ 
anit πι κ; 
(eng 
return ERROR; 
k = MAX_SIZE - 1; 
for 4 511 <= i - 1) 111) 
k = L[k].cur; 
J = Piki επ 


Diki eur = ur, 


Free SSL(l, 3); 


return OK; 


有 了 刚才 的 基础 ， 这 段 代码 就 很 容易 理解 了 。 前 面 代 码 都 一 样 ，for 循 
环 因为 i=1 而 不 操作 ，j=L[999].cur=1，L[k].cur=L[j].cur 也 就 是 
L[999].cur=L[1].cur=2。 这 其 实 就 是 告诉 计算 机 现在 “ 甲 ” 已 经 离开 

ef ，“ 乙 ” 才 是 第 一 个 元 素 。Free_SSL (Lj) ;是 什么 意思 呢 ? 来 看 代 


/* 将 下 标 为 K 的 空闲 结 点 回收 到 备用 链表 */ 


void Free_SSL(StaticLinkList space, int Κ) 


{ 


/* 把 第 一 个 元 素 cur 值 赋 给 要 删除 的 分 量 cur 3/ 


space[k].cur = space[0].cur; 


/* 把 要 删除 的 分 量 下 标 赋值 给 第 一 个 元 素 的 cur */ 


space[0].cur = k; 


意思 就 是 “ 甲 ” 现 在 要 走 ， 这 个 位 置 就 空 出 来 了 ， 也 就 是 ， 未 来 如 有 果 有 
新 人 来 ， 最 优先 考虑 这 里 ， 所 以 原来 的 第 一 个 空位 分 量 ， 即 下 标 是 8 的 
分 量 ， 它 降级 了 ， 把 8 给 “ 甲 ?所 在 下 标 为 1 的 分 量 的 cur， 也 吏 是 


space[1].cur=space[0].cur=8， 而 space[0].cur=k=1 其 实 就 是 让 这 个 删除 的 
位 置 成 为 第 一 个 优先 空位 ， 把 它 存 入 第 一 个 元 素 的 cur 中 ， 如 图 3-12-4 
所 示 。 


图 3-12-4 


当然 ， 静 态 链 表 也 有 相应 的 其 他 操作 的 相关 实现 。 比 如 我 们 代码 中 的 
ListLength 残 是 一 个 ， 来 看 代码 。 


/* 初始 条 件 : 静态 链表 L 已 存在 。 操 作 结果 : 返回 L 
中 数据 元 素 个 数 */ 


int ListLength(StaticLinkList L) 
a 
int j = 0; 
int i = L[MAXSIZE - 1].cur; 
while (i) 
κ 
ας εν Πα el ee 
Jpn 
} 


return j; 


另外 一 些 操 作 和 线性 才 的 基本 操作 相同 ， 实 现 上 也 不 复杂 ， 我 们 在 课 
党 上 就 不 讲解 了 。 


3.12.3 ”静态 链表 优 缺 点 
总 结 一 下 静态 链表 的 优 缺 点 ( 见 图 3-12-5) : 


η η 


' 在 插入 和 删除 操作 时 ， "没有 解决 连续 存储 分 本 
πι ΜΗ, ή ORE SHELA Be 
要 移动 元 素 ， 从 而 改进 H 
SHEMET] ART REFERER 
Hi AMER TF m H 机 存 取 的 特性 

动 大 量 元 素 的 缺 后 


图 3-12-5 


总 的 来 说 ， 静 态 链表 其 实 是 为 了 给 没有 指针 的 高 级 语言 设计 的 一 种 实 
现 单 链表 能 力 的 方法 。 尽 管 大 家 不 一 定 会 用 得 上 ， 但 这 样 的 思考 方式 
是 非常 巧妙 的 ， 应 该 理解 其 思想 ， 以 备 不 时 之 需 。 

3.13 ”循环 链表 

在 座 的 各 位 都 很 年 轻 ， 不 会 觉得 日 月 如 梭 。 可 上 了 点 年 纪 的 人 ， 比 如 
我 一 一 的 父 昔 们 ， 就 常常 感慨 ， 要 是 可 以 回 到 从 前 该 多 好 。 网 上 也 盛 


传 ， 所 请 的 成 功 男人 束 是 3 岁 时 不 尿 社 子 ，5 岁 能 目 己 吃饭 .….….80 岁 能 
目 己 吃饭 ，90 岁 能 不 尿 裤子 。 


图 3-13-1 


对 于 单 链表 ， 由 于 每 个 结 点 只 存储 了 向 后 的 指针 ， 到 了 尾 标 志 束 停止 
了 辣 后 链 的 操作 ， 这 样 ， 当 中 某 一 结 扣 束 无 法 找到 它 的 前 驱 结 点 了 ， 
下 像 我 们 刚才 说 的 ， 不 能 回 到 从 前 。 


比如 ， 你 是 一 业务 员 ， 家 在 上 海 。 需 要 经 党 出 差 ， 行程 束 是 上 海 到 北 
泵 一 路 上 的 城市 ， 找 客户 谈 生 意 或 分 公司 办 理 业务 。 你 从 上 海 出 发 ， 
乘 火 车 路 经 多 个 城市 停留 后 ， 再 乘 飞 机 返回 上 海 ， 以 后 ， 每 隔 一 段 时 
间 ， 你 基本 还 要 按照 这 样 的 行程 开展 业务 ， 如 图 3-13-2 所 示 。 


ΕΝ πΧ ΣΑ 1 
πι. th α« «αῸ ee α. 8 ee 
图 3-13-2 


有 一 次 ， 你 先 到 南 系 开会 ， 接 下 来 要 对 以 上 的 城市 走 一 过 ， 此 时 有 人 
对 你 遂 ， 不 行 ， 你 得 从 上 海 开 始 ， 因 为 上 海 是 第 一 站 。 你 会 对 这 人 说 
什么 ? 神经 病 。 哪 有 这 么 傻 的 ， 直 接 回 上 海 根 本 没有 必要 ， 你 可 以 从 
南 泵 开始 ， 下 一 站 蚌 塌 ， 直 到 北京 ， 之 后 再 考 虚 走 完 上 海 及 苏 南 的 几 
个 城市 。 显 然 这 表示 你 是 从 当中 一 结 扣 开始 裔 历 整 个 链表 ， 这 都 吓 原 
来 的 单 链 表 结 构 解 决 不 了 的 问题 。 


事实 上 ， 把 北京 和 上 海 之 间 连 起 来 ， 形 成 一 个 环 吏 解 决 了 前 面 所 面临 
的 困难 。 这 束 古 我 们 现在 要 讲 的 循环 链表 。 


将 单 链 表 中 终端 结 点 的 指针 端 由 空 指针 改 为 指 回头 结 点 ， 就 使 整个 单 
链表 形成 一 个 环 ， 这 种 头 尾 相 接 的 单 链 表 称 为 单 循 环 链表 ， 倘 称 循环 
链表 (circular linked list) 5 
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何 从 当中 一 个 结 点 出 发 ， 访 问 到 链表 的 全 部 结 点 。 


为 了 使 空 链表 与 非 至 链表 处 理 一 致 ， 我 们 通 单 设 一 个 头 结 点 ， 当 然 ， 
这 并 不 是 说 ， 循 环 链表 一 定 要 头 结 点 ， 这 需要 注意 。 循 环 链表 这 有 头 


结 点 的 空 链 表 如 图 3-13-3 所 示 : 


KIAT 


图 3-13-3 
对 于 非 空 的 循环 链表 就 如 图 3-13-4 所 示 。 


}3-13-4 


LSC ETA re eA Β HE Fe A EE FTE TA I ARE, Re 
判断 p->next 是 否 为 空 ， 现 在 则 是 p->next 不 等 于 头 结 点 ， 则 循环 未 结 
束 。 


在 单 链 表 中 ， 我 们 有 了 头 结 点 时 ， 我 们 可 以 用 O(G) 的 时 间 访 问 第 一 个 
结 点 ， 但 对 于 要 访问 到 最 后 一 个 结 点 ， 却 需要 O(n) 时 间 ， 因 为 我 们 需 


BERS HEE ΠΕ ΕΡΤ o 

和 没有 可 能 用 O(1) 的 时 间 由 链表 指针 访问 到 最 后 一 个 结 点 呢 ? 当然 可 
P] ο 
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结 点 的 尾 指针 来 表示 循环 链表 (如 图 3-13-5 所 示 ) ， 此 时 查找 开始 结 点 
和 终 闪 结 点 都 很 方便 了 。 


图 3-13-5 


从 上 疼 中 可 以 看 到 ， 终 端 结 点 用 尾 指针 rear 指 示 ， 则 碍 找 终端 结 点 是 
O(D)， 而 开始 结 点 ， 其 实 就 是 rear->next->next， 其 时 间 复 杂 也 为 O(1) 。 


举 个 程序 的 例子 ， 要 将 两 个 循环 链表 合并 成 一 个 表 时 ， 有 了 尾 指针 职 
非常 简单 了 。 比 如 下 面 的 这 两 个 循环 链表 ， 它 们 的 尾 指针 分 别 是 rearA 
和 rearB， 如 图 3-13-6 所 示 。 


一 一 rearA 


rearA> next 


一 一 一 rearB 


rearB-> next rearB-> next> next 


图 3-13-6 
要 想 把 它们 合并 ， 只 需要 如 下 的 操作 即 可 ， 如 图 3-13-7 所 示 。 


一 一 


一 一 


rearA-> next 


== 


rearB-> next-> next 


图 3-13-7 


/* 保存 A 表 的 头 结 点 ， 即 四 */ 


p = rearA->next; 


/* 将 本 是 指向 B 表 的 第 一 个 结 点 〈 不 是 头 结 点 ) */ 
rearA->next = rearB->next->next; 
/* 赋值 给 reaA->next， 即 @ */ 


q = rearB->next; 


/* 将 原 A 表 的 头 结 点 赋值 给 rearB->next， 即 @) */ 
rearB->next = p; 
/* 释放 q */ 


free(q); 


3.14 ”双向 链表 


继续 我 们 刚才 的 例子 ， 你 平时 都 是 从 上 海 一 路 停留 到 北京 的 ， 可 是 这 
一 次 ， 你 得 先 到 北京 开会 ， 谁 叫 北京 是 首都 呢 ， 会 下 是 多 。 开 完 会 
后 ， 你 需要 例行公事 ， 走 访 各 个 城市 ， 此 时 你 怎么 办 ? 


oa 
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图 3-14-1 


有 人 又 出 主意 了 ， 你 可 以 和 多 飞 回 上 海 ， 一 路 再 乘 火车 走 思 这 几 个 城 
市 ， 到 了 北京 后 ， 你 再 飞 回 上 海 。 


你 会 感慨 ， 人生 中 为 什么 总 会 有 这 样 出 馈 主 意 的 人 存在 呢 ? 真 要 气 死 
ο ο ρα 
[ ο 
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图 3-14-2 


对 呀 ， REIT AINE TEER E, 23} AERAR 
我 们 的 单 链表 ， 总 是 从 头 到 尾 找 结 点 ， SERN ET DLE IG ABT 
吗 ? 当然 可 以 ， 只 不 过 需要 加 点 东西 而 已 。 


我 们 在 单 链表 中 ， 有 了 next 指 针 ， 这 束 使 得 我 们 要 碍 找 下 一 结 点 的 时 间 
复杂 度 为 O(1)。 可 是 如 果 我 们 要 查找 的 是 上 一 结 点 的 话 ， 那 最 坏 的 时 
间 复 杂 度 融 是 OOD 了 ， 因 为 我 们 每 次 都 要 从 头 开 始 思 有 历 碍 找 。 
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双向 链表 (double linkedlist) 是 在 单 链 表 的 每 个 结 点 中 ， 再 设置 一 个 指 
问 其 前 碟 结 总 的 指针 域 。 所 以 在 双 回 链表 中 的 结 点 都 有 两 个 指针 域 ， 
一 个 指 疝 直 接 后 继 ， 男 一 个 指 疝 直 接 前 驱 。 


ον (δὴ 


τὸ 


生 表 的 双向 链表 存储 结构 */ 


typedef struct DulNode 


{ 


ElemType data; 


struct DuLNode *prior; /* 直接 前 驱 指 针 */ 


struct DuLNode *next; /* 直接 后 继 指 针 */ 


} DulNode, *DuLinkList; 


既然 单 链 表 也 可 以 有 循环 链表 ， 那 么 双 癌 链表 当然 也 可 以 是 循环 表 。 
双 癌 链表 的 循环 市 尖 结 点 的 空 链 表 如 图 3-14-3 所 示 。 


头 指针 


图 3-14-3 
非 空 的 循环 的 带头 结 点 的 双向 链表 如 图 3-14-4 所 示 。 


图 3-14-4 


由 于 这 是 双 回 链表 ， 那 么 对 于 链表 中 的 某 一 个 结 点 p， 它 的 后 继 的 前 豫 
EE? 当然 还 是 它 目 己 。 写 的 前 张 的 后 继 目 然 也 是 它 目 己 ， 即 : 


p->next->prior = p = p->prior->next 


RANA] EA Rae IN, 那么 上 海 的 下 一 站 的 前 一 站 是 哪里 ? 
了 哈哈， 有 点 废话 的 感觉 。 


双 癌 链表 是 单 链表 中 扩展 出 来 的 结构 ， 所 以 它 的 很 多 操作 是 和 单 链 表 
相同 的 ， 比 如 求 长 度 的 ListLength， 查 找 元 素 的 GetElem， 获 得 元 素 位 
置 的 LocateElem 等 ， 这 些 操作 都 只 要 涉及 一 个 方 同 的 指针 即 可 ， 男 一 指 
针 多 了 也 不 能 提供 什么 帮助 。 

号 像 人 生 一 样 ， 想 至 乐 束 得 先 努 力 ， 欲 收获 就 得 付 代 价 。 双 向 链表 既 
然 是 比 单 链表 多 了 如 可 以 反 向 遍历 查找 等 数据 结构 ， 那 么 也 就 需要 付 
出 一 些小 的 代价 : 在 插入 和 删除 时 ， 需 要 更 改 两 个 指针 变量 。 

插入 操作 时 ， 其 实 并 不 复杂 ， 不 过 顺序 很 重要 ， 于 万 不 能 写 反 了 。 


我 们 现在 假设 存储 元 素 e 的 结 点 为 s， 要 实现 将 结 点 s 插 入 到 结 点 p 和 p- 
>next 之 间 需 要 下 面 儿 步 ， 如 图 3-14-5 所 示 。 


s->prior = p; 


Epic (24 SAY BSL, 


Ep->next HEA shak, “πβ 


p->next; 


巴 s 赋 值 给 p->next 的 前 驱 ， 如 区 


p->next->prior 


Ps 赋 值 给 p 的 后 继 ， 如 区 


关键 在 于 它们 的 顺序 ， 由 于 第 2 步 和 第 3 步 都 用 到 了 p->next。 如 果 第 4 步 
完 执行 ， 则 会 使 得 p->next 提 前 变 成 了 s， 使 得 插入 的 工作 完 不 成 。 所 以 
我 们 不 妨 把 上 面 这 张 图 在 理解 的 基础 上 记忆 ， 顺 序 是 先 搞定 s 的 前 驱 和 
后 继 ， 再 搞定 后 结 点 的 前 驱 ， 最 后 解决 前 结 点 的 后 继 。 


如 朱 插 入 操作 理解 了 了， 那么 删除 操作 ， 束 比较 商 单 了 。 
铬 要 删除 结 点 5p， 只 需要 下 面 两 步 台 ， 如 图 3-14-6 所 示 。 


图 3-14-6 


τπτ 
11 
Θ 
* 
= 


/* 把 p->next 赋 值 给 p->prior 的 后 继 ， 如 图 


p->prior->next = p->next; 


/* 把 p->prior 赋 值 给 p->next 的 前 驱 ， 如 图 中 @ */ 


p->next->prior = p->prior; 
/* 释放 结 点 */ 


free(p); 


好 了 ， 简 单 总 结 一 下 ， 双 回 链 表 相 对 于 单 链表 来 说 ， 要 更 复杂 一 些 ， 

毕竟 它 多 了 prior 指 针 ， 对 于 插入 和 删除 时 ， 需 要 格外 小 心 。 另 外 它 由 
于 每 个 结 点 都 需要 记录 两 份 指针 ， 所 以 在 空间 上 是 要 占用 略 多 一 些 

的 。 不 过 ， 由 于 它 民 好 的 对 称 性 ， 使 得 对 某 个 结 点 的 前 后 结 点 的 操 

作 ， 帝 来 了 方便 ， 可 以 有 效 提高 算法 的 时 间 性 能 。 说 日 了 了， 就 是 用 空 
间 来 换 时 间 。 


3.15 “总结 回顾 
这 一 曹 ， 我 们 主要 讲 的 是 线性 表 。 


先 谈 了 它 的 定义 ， 线 性 表征 零 个 或 多 个 具有 相同 类 型 的 数据 元 素 的 有 
限 序 列 。 然 后 谈 了 线性 表 的 抽象 数据 类 型 ， 如 它 的 一 些 基 本 操作 。 


之 后 我 们 就 线性 表 的 两 大 结构 做 了 讲述 ， 先 讲 的 是 比较 容易 的 顺序 存 
储 结构 ， 指 的 是 用 一 段 地 址 连续 的 存储 单元 依次 存储 线性 表 的 数据 元 
素 。 通 单 我 们 都 是 用 数组 来 实现 这 一 结构 。 


后 来 是 我 们 的 重点 ， 由 顺序 存储 结构 的 插入 和 删除 操作 不 方便 ， 引 出 
了 链 式 存储 结构 。 它 具有 不 受 固 定 的 存储 空间 限制 ， 可 以 比较 快捷 的 
插入 和 删除 操作 的 特点 。 人 然后 我 们 分 别 融 链 式 存 储 结构 的 不 同形 式 ， 
如 单 链表 、 循 环 通 表 和 双 回 链表 做 了 讲解 ， 邦 外 我 们 还 讲 了 知 不 使 用 
指针 如 何 处 理 链表 结构 的 静态 链表 方法 。 


总 的 来 说 ， 线 性 表 的 这 两 种 结构 (如 图 3-15-1 所 示 ) 其 实 是 后 面 其 他 数 
αν ο ο ο 


线性 表 
ΜΗΝ ENE MAN 
HER HOEK Ίνα ΠΠ 


图 3-15-1 
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知道 为 什么 河 里 钩 起 来 的 鱼 要 比 鱼 塘 里 养 的 鱼 好 吃 吗 ? 因为 鱼 塘 里 的 
鱼 ， 天 天 有 人 喂 ， 没 有 天 政 退 ， 束 等 着 养 肥 给 人 吃 ， 一 天 到 晚 游 快 游 
慢 痢 一 样 ， 号 上 鱼肉 不 多 ， 和 鱼油 不 少 。 而 河 里 的 鱼 ， 为 了 吃 饱 ， 为 了 
避免 修 更 大 的 鱼 吃 挥 ， 它 必须 要 不 断 地 游 。 这 样 生存 下 来 的 鳃 ， 那 鱼 
AZ HER BAB Est ` RO 5 


κ ΕΛΜΕ ΛΑ, BERR B 142 885-36, ERS 
度 下， 他 们 的 生活 被 社会 安排 好 了 ， 先 科 员 再 科 长 、 后 处 长 再 局 长 ， 
混 到 哪 算 哪 学徒、 技工、 高 级 技工 ; 教师、 中 级 教师 、 高 级 教师 ， 
总 之 无 论 哪 个 行业 都 论 资 排 辈 。 这 样 的 生活 如 何 让 人 理发 努力 ， 所 以 
ο ο. 
gj， 一 切 都 得 慢 慢 来 。 


可 见 ， 舒 适 环境 是 很 难 培养 出 坚强 品格 ， 被 安排 好 的 人 生 ， 也 很 难 做 
出 伟大 事业 。 


市 场 经 济 社会 下 ， 机 会 束 大 多 了 ， 你 可 以 从 社会 的 任何 一 个 位 置 开 始 
起 步 ， 只 要 你 真有 决心 ,没有 人 可 以 拦 着 你 。 事 实 也 证 明 ， 无 论 出 身 
苹 什 么 ， 之 前 是 闭 藻 还 是 证 足 ， 部 有 出 人 头 地 的 一 天 。 当 然 ， 这 也 下 
意味 着 ， 面 临 的 竞争 也 是 空前 激烈 的 ， 一 不 小 心 ， 你 的 位 置 束 可 能 被 


人 插足 ， 甚 至 你 束 得 out 出 局 。 这 也 多 像 我们 线性 表 的 链 式 存储 结构 ， 
任何 位 置 都 可 以 插入 和 删除 。 
MAE, ΠΟΠ ΕΕ ΓΕ, TANCE, ποπ 3 {ο πμ (κ te Le 
受 非 ， 假 设 你 可 以 活 到 80 多 ， 其 实 你 最 多 也 融 吃 了 20 年 兰 。 用 人 生 四 
分 之 一 的 时 间 来 换取 其 余 时 间 的 幸福 生活 ， 这 点 天 不 算 喻 。 再 说 了 ， 
跟着 我 学 习 ， 这 也 能 算是 吃 否 ? 


好 了 ， 今 天 课 就 到 这 ， 下 课 。 

第 4 章 栈 与 队列 

启示 

栈 与 队列 | 

栈 是 限定 仅 在 表 尾 进行 插入 和 删除 操作 的 线性 表 。 

BLE MET UE > TTEA — HT 
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同学 们 ， 大 家 好 ! 我 们 又 见面 了 。 


不 知道 大 家 有 没有 玩 过 手枪 ， 估 计 都 没有 。 现 在 和 平年 代 ， 上 哪 去 玩 
这 种 危险 的 真 东西 ， 就 是 仿真 玩具 也 大 都 被 限制 了 。 我 小 时 候 在 军训 
时 ， 也 算是 一 次 机 会 ， 几 个 老兵 和 我 们 学 生 聊天 ， 让 我 们 学 习 了 一 下 
关于 枪 的 知识 。 


当时 那个 老兵 告诉 我 们 ， 早 移 军 官 们 都 爱 用 左轮 手枪 ， 而 非 弹 夹 式 手 
枪 ， 问 我 们 为 什么 ， 我 们 谁 也 说 不 上 来 。 现 在 我 要 问 问 你 们 ， 知 道 为 
什么 吗 ? Ch RAE) 


哈 ， 我 昕 到 下 面 有 同学 说 是 因为 左轮 手枪 好 看 ， 酷 蚜 。 品 ， 当 然 不 古 
这 个 原因 。 算 了 ， 信 计 你 们 也 很 难 狂 得到。 他 那 时 告诉 我 们 说 ， 因 为 
子弹 质量 不 过 关 ， 有 个 别 可 能 是 具 硬 一 一 也 融 是 有 问题 的 、 打 不 出 来 
的 子弹 。 弹 夹 式 手枪 (如 图 4-1-1 所 示 ) ， 如 果 当 中 有 一 颗 是 卡 住 了 的 


身 弹 ， 那 么 后 面 的 子弹 束 都 打 不 了 了 。 想 想 看 ， 在 你 准备 用 枪 的 时 
候 ， 那 基本 到 了 不 是 你 死 束 是 我 亡 的 时 刻 ， 突 然 这 手枪 明明 有 子弹 却 
打 不 出 来 ， 这 不 是 要 命 吗 ? 而 左轮 手枪 整 不 存在 这 问题 ， 这 一 颗 不 
行 ， 转 到 下 一 颗 就 可 以 了 ， 人 总 不 会 倒霉 到 六 颗 全 是 具 弹 。 当 然 ， 后 
来 子弹 质量 基本 过 关 了 ， 由 于 弹 夹 可 以 放 8 颗 甚至 20 颗 子弹 ， 比 元 纶 手 
枪 的 只 能 放 6 颗 子弹 要 多 ， 所 以 后 来 普及 率 更 高 的 还 是 弹 夹 式 的 手枪 。 


图 4-1-1 

哦 ， 原 来 如 此 。 我 当时 目 认 为 聪明 的 说 道 : 那 很 好 办 呀 ， 这 弹 夹 不 是 
先 放 进去 的 子弹 ， 最 后 才 可 以 打出 来 吗 ? 你 可 以 把 具 弹 最 先 放 进 去 ， 
好 子弹 留 在 后 面 ， 这 样 束 不 会 影响 了 呀 。 


他 笑 吕 道人 笨蛋 ， 如 采 真 的 知道 哪 一 颗 是 具 弹 ， 还 放 进 去 干吗 ， 早 就 
扔 了 。 (KRKE) 


哎 ， 我 其 实 一 直 都 是 有 点 笨 笨 的 。 
4.2” 栈 的 定义 


4.2.1 栈 的 定义 


好 了 ， 衣 这 个 例子 目的 不 是 要 告诉 你 们 我 当年 有 多 人生， 而 是 为 了 引出 
今天 的 主题 ， 束 是 类 似 弹 夹 中 的 子弹 一 样 匈 进去 ， 却 要 后 出 来 ， 而 后 
进 的 ， 反 而 可 以 先 出 来 的 数据 结构 一 一 栈 。 


在 我 们 软件 应 用 中 ， 栈 这 种 后 进 先 出 数据 结构 的 应 用 是 非常 普遍 的 。 
比如 你 用 浏览 硕 上 网 时 ， 不 管 什 么 浏 狗 如 都 有 一 个 “后 退 " 键 ， 你 点 击 
后 可 以 按 访 问 顺序 的 逆序 加 载 浏览 过 的 网 页 。 比 如 你 本 来 看 着 新 闻 好 
好 的 ， 突 然 看 到 一 个 链接 说 ， 有 个 可 以 让 你 年 薪 100 万 的 工作 ， 你 过 不 
犹豫 点 击 它 ， 跳 罗 进 去 一 看 ， 这 都 是 哈 呀 ， 具 体内 容 我 也 融 不 说 了 ， 
骗 人 骗 得 一 点 水 平 都 没有。 此 时 你 还 想 回 去 继续 看 新 闻 ， 束 可 以 点 击 
左上 和 角 的 后 退 键 。 即 使 你 从 一 个 网 页 开始 ， 连 续 点 了 几 十 个 链接 跳 
辑 ， 你 点 “后 退 ”" 时 ， 还 是 可 以 像 历史 倒退 一 样 ， 回 到 之 前 浏 哆 过 的 蘑 
个 页 面 ， 如 图 4-2-1 所 示 。 


Æ Google - Windows Internet Explorer 


ολ. ms | http://www.google.com.hk/\ 
ως. 


图 4-2-1 


很 多 类 似 的 软件 ， 比 如 Word、Photoshop 等 文档 或 图 像 编辑 软件 中 ， 都 
有 撤销 (undo) 的 操作 ， 也 是 用 栈 这 种 方式 来 实现 的 ， 当 然 不 同 的 软 
件 具体 实现 代码 会 有 很 大 差异 ， 不 过 原理 其 实 部 是 一 样 的 。 


栈 (stack) 是 限定 仅 在 表 尾 进行 插入 和 删除 操作 的 线性 表 。 

我 们 把 允许 插入 和 删除 的 一 端 称 为 栈 顶 (top) ， 男 一 端 称 为 栈 底 
(bottom) ， 不 含 任 何 数据 元 素 的 栈 称 为 空 栈 。 栈 又 称 为 后 进 先 出 
(LastIn First Out) 的 线性 表 ， 简 称 LIFO 结 构 。 

理解 栈 的 定义 需要 注意 : 

首先 它 是 一 个 线性 表 ， 也 就 是 说 ， 栈 元 素 具 有 线性 关系 ， 即 前 驱 后 继 

天 系 。 只 不 过 它 是 一 种 特殊 的 线性 表 而 已 。 定 义 中 说 是 在 线性 表 的 表 

尾 进行 插入 和 删除 控 作 ， 这 里 表 尾 是 指 栈 顶 ， 而 不 是 栈 拘 。 


它 的 符 殊 之 处 束 在 于 限制 了 这 个 线性 表 的 插入 和 删除 位 置 ， 它 始终 只 
在 栈 顶 进行 。 这 也 就 使 得 ， 栈 瓜 是 固定 的 ， 最 先进 栈 的 只 能 在 栈 研 。 


, τ 叫 作 进 栈 ， 也 称 压 栈 、 入 栈 。 类 似 子弹 入 弹 夹 ， 如 图 4- 
πο ανα 


栈 的 删除 操作 ， 叫 作出 栈 ， 也 有 的 叫 作 弹 栈 。 如 同 弹 夹 中 的 子弹 出 
夹 ， 如 图 4-2-3 所 示 。 


BOE 


图 4-2-3 

4.2.» ” 进 栈 出 栈 变化 形式 

ο ο ολα 
NE‘ 


答案 是 不 一 定 ， 要 看 什么 情况 。 栈 对 线性 表 的 插入 和 删除 的 位 置 进行 
了 限制 ， 并 没有 对 元 素 进出 的 时 间 进 行 限制 ， 也 束 是 讽 ， 在 不 是 所 有 
元 素 都 进 栈 的 情况 下 ， 事 先进 去 的 元 素 也 可 以 出 栈 ， 只 要 保证 古 栈 顶 
JEA HRH DA 5 


举例 来 说 ， 如 采 我 们 现在 是 有 3 个 整 型 数字 元 素 1、2、3 依 次 进 栈 ， 会 
有 哪些 出 栈 次 序 呢 ? 


。 第 一 种 : 1、2、3 进 ， 再 3、2、1 出 。 这 是 最 简单 的 最 好 理解 的 一 
种 ， 出 栈 次 序 为 321 。 

。 第 二 种 : 1 进 ，1 出 ，2 进 ，2 出 ，3 进 ，3 出 。 也 就 是 进 一 个 就 出 一 

个 ， 出 栈 次 序 为 123。 

第 三 种 :1 进 ，2 进 ，2 出 ，1 出 ，3 进 ，3 出 。 出 栈 次 序 为 213。 

第 四 种 :1 进 ，1 出 ，2 进 ，3 进 ，3 出 ，2 出 。 出 栈 次 序 为 132。 

第 五 种 : 1 进 ，2 进 ，2 出 ，3 进 ，3 出 ，1 出 。 出 栈 次 序 为 231 © 


有 没有 可 能 是 312 这 样 的 次 序 出 栈 呢 ? 答案 是 肯定 不 会 。 因 为 3 先 出 

栈 ， 束 意味 着 ，3 曾 经 进 栈 ， 既 然 3 都 进 栈 了 ， 那 也 就 意味 着 ，1 和 2 已 

经 进 栈 了 ， 此 时 ，2 一 定 是 在 1 的 上 面 ， 束 是 更 接近 栈 顶 ， 那 么 出 栈 只 

᾿ ο ον 所 以 此 时 不 会 发 生 1 比 2 
9 情况。 


从 这 个 简单 的 例子 就 能 看 出 ， 只 是 3 个 元 素 ， 就 有 5 种 可 能 的 出 栈 次 
ο ο ο. 
FA 。 


4.3 ” 栈 的 抽象 数据 类 型 


对 于 栈 来 讲 ， 理 论 上 线性 表 的 操作 特性 它 都 具备 ， 可 由 于 它 的 特殊 
性 ， 所 以 针对 它 在 操作 上 会 有 些 变化 。 特 别 是 插入 和 删除 操作 ， 我 们 
改名 为 push 和 pop， 英 文 直 详 的 话 是 压 和 弹 ， 更 容易 理解 。 你 丈 把 它 当 
成 是 弹 夹 的 子弹 压 入 和 弹出 就 好 记忆 了 ， 我 们 一 般 叫 进 栈 和 出 栈 。 


ADT 栈 (stack) 


Data 


同 线性 表 。 元 素 具有 相同 的 类 型 ， 相 邻 元 素 具 有 前 驱 和 后 继 关 系 。 


Operation 


InitStack(*S): 初始 化 操作 ， 建 立 一 个 空 栈 S 。 


DestroyStack(*S): 若 栈 存在 ， 则 销毁 它 。 


ClearStack(*S): ”将 栈 清空 。 


StackEmpty(S): 若 栈 为 空 ， 返 回 true， 否 则 返回 false « 


GetTop(S, *e): 若 栈 存在 且 非 空 ， 用 e 返 回 Ss 的 栈 顶 元 素 。 
Push(*S, e): 若 栈 S 存 在 ， 插 入 新 元 素 e 到 栈 S 中 并 成 为 栈 顶 元 素 。 
Pop(*S, 36): 删除 栈 S 中 栈 顶 元 素 ， e 返 回 其 值 。 


StackLength(S): ， 返回 栈 S 的 元 素 个 数 。 


endADT 


由 于 栈 本 身 就 是 一 个 线性 表 ， 那 么 上 一 章 我 们 讨论 了 线性 表 的 顺序 存 
储 和 链 式 存储 ， 对 于 栈 来 说 ， 也 是 同样 适用 的 。 
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4.4.1 栈 的 顺序 存储 结构 


既然 栈 是 线性 表 的 特例 ， 那 么 栈 的 顺序 存储 其 实 也 是 线性 表 顺 序 存储 
的 向 化 ， 我 们 简称 为 顺序 栈 。 线 性 表 十 用 数组 来 实现 的 ， 想 想 看 ， 对 
于 栈 这 种 只 能 一 头 插入 删除 的 线性 表 来 说 ， 用 数组 哪 一 端 来 作为 栈 顶 
和 栈 压 比较 好 ? 


对 ， 没 锯 ， 下 标 为 0 的 一 端 作为 栈 故 比较 好 ， 因 为 痛 元 素 部 存在 栈 属 ， 
变化 最 小 ， 所 以 让 它 作 栈 拘 。 


我 们 定义 一 个 top 变 量 来 指示 栈 顶 元 素 在 数组 中 的 位 置 ， 这 top 融 如 同 中 
学 物理 学 过 的 游标 卡尺 的 游标 ， 如 图 4-4-1， 它 可 以 来 回 移动 ， 意 味 着 
栈 顶 的 top 可 以 变 大 变 小 ， 但 无 论 如 何 游 标 不 能 超出 尺 的 长 度 。 同 理 ， 
大 存储 栈 的 长 度 为 StackSize， 则 栈 顶 位 置 top 必 须 小 于 StackSize。 当 栈 
站 元素 时 ，top 等 于 0， 因 此 通常 把 空 栈 的 判定 条 件 定 为 top 等 
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图 4-4-1 


来 看 栈 的 结构 定义 


/* SElemType 类 型 根据 实际 情况 而 定 ， 这 里 假设 为 jnt */ 
typedef int SElemType; 


typedef struct 


ae 
SElemType data[MAXSIZE]; 
/* 用 于 栈 顶 指针 */ 
int top; 

}SqStack; 


看 现在 有 一 个 栈 ，StackSize 是 5， 则 栈 普 通 情况 、 空 栈 和 栈 满 的 情况 、 
空 栈 和 栈 满 的 情况 示意 图 如 图 4-4-2 所 示 。 


top 
` — μμ. ith 
KAMER ΖΗ, 

top=l top=l 


图 4-4-2 
4.4.2” 栈 的 顺序 存储 结构 一 一 进 栈 操作 
对 于 栈 的 插入 ， 即 进 栈 操作 ， 其 实 就 是 做 了 如 图 4-4-3 所 示 的 处 理 。 


数组 data， 
长 度 为 5 


图 4-4-3 
因此 对 于 进 栈 操作 push， 其 代码 如 下 : 


/* 插入 元 素 e 为 新 的 栈 顶 元 素 */ 


Status Push(SqStack *S, SElemType e) 
η 
/* ἘΝ», 


if (S->top == MAXSIZE - 1) 
sf 

return ERROR; 
} 
/* 栈 顶 指针 增加 一 */ 
S->topt++; 


/* 将 新 插入 元 素 赋值 给 栈 顶 空间 * / 


S->data[S->top] = e; 


return OK; 


4.4.3” 栈 的 顺序 存储 结构 
操作 
出 栈 操作 pop， 代 码 如 下 : 


出 栈 


/* 若 栈 不 空 ， 则 删除 S 的 栈 顶 元 素 ， 用 e 返 回 其 值 ， 


返回 OK; 否则 返回 ERROR */ 


Status Pop(SqStack *S, SElemType *e) 


a 
if (S->top == -1) 
return ERROR; 
/* 将 要 删除 的 栈 顶 元 素 赋 值 给 e */ 
*e = S->data[S->top]; 
/* 栈 顶 指针 减 一 */ 
5-2ἴορ--; 
return OK; 
} 


两 者 没有 涉及 到 任何 循环 语句 ， 因 此 时 间 复 杂 度 均 是 0(1)。 


45 ”两 栈 共享 空间 


其 实 栈 的 顺序 存储 还 是 很 方便 的 ， 因 为 它 只 准 栈 顶 进出 元 素 ， 所 以 不 
存在 线性 表 插 入 和 删除 时 需要 移动 元 素 的 问题 。 不 过 它 有 一 个 很 大 的 
缺陷 ， 就 是 必须 事先 确定 数组 存储 空间 大 小 ， 万 一 不 够 用 了 ， 整 需要 
编程 手段 来 扩展 数组 的 容量 ， 非 音 麻 烦 。 对 于 一 个 栈 ， 我 们 也 只 能 尽 
量 考 虑 周全 ， 设 计 出 合适 大 小 的 数组 来 处 理 ， 但 对 于 两 个 相同 类 型 的 
ΤΥ ''.''' 


TIS ETAT, PASAY BIER ΓΕ, Fani, ΠΗ}: 
了 这 么 多 年 学 校 的 集体 牺 售 ， 现 在 工作 了 一 定 要 有 目 己 的 私密 空间 。 
于 是 他 们 都 希望 租房 时 能 找到 独 住 的 一 大 宇 ， 可 找 来 找 去 却 发 现 ， 最 
便宜 的 一 居室 也 要 每 月 1500 元 ， 地 段 还 不 好 ， 实 在 是 承受 不 起 ， 最 终 
他 俩 还 是 合租 了 一 套 两 居室 ， 一 共 2000 元 ， 各 出 一 半 ， 还 不 错 。 


对 于 两 个 一 居室 ， 都 有 独立 的 卫生 间 和 厨房 ， 是 私密 了 ， 但 大 部 分 空 
间 的 利用 率 却 不 高 。 而 两 居室 ， 两 个 人 各 有 革 室 ， 还 共 序 了 客厅 、 奈 
ὄΔὄΔὄΔὄΔΛΞΔὄΞ.---:---; 


pau 


同样 的 道理 ， 如 采 我 们 有 两 个 相同 类 型 的 栈 ， 我 们 为 它们 各 目 开 辟 了 
数组 空间 ， 极 有 可 能 是 第 一 个 栈 已 经 满 了 ， 再 进 栈 就 溢出 了 ， 而 另 一 
个 栈 还 有 很 多 存储 空间 空间 。 这 又 何必 呢 ? 我 们 完全 可 以 用 一 个 数组 
来 存储 两 个 栈 ， 只 不 过 需要 点 小 技巧 。 


我 们 的 做 法 如 图 4-5-1， 数 组 有 两 个 端点 ， 两 个 栈 有 两 个 栈 砌 ， 让 一 个 
栈 的 栈 底 为 数组 的 始 端 ， 即 下 标 为 0 处 ， 另 一 个 栈 为 数组 的 末端 ， 即 下 
ΘΝ  ΉΠ 
qE o 
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图 4-5-1 


其 实 关键 思路 是 : 它们 是 在 数组 的 两 端 ， 向 中 间 靠 拢 。top1 和 top2 是 栈 
ο 可 以 想象 ， 只 要 它们 俩 不 见面 ， 两 个 栈 束 可 以 一 


从 这 里 也 就 可 以 分 析出 来 ， 栈 1 为 空 时 ， 就 是 top1 等 于 -1 时 ;， 而 当 top2 
等 于 n 时 ， 即 是 栈 2 为 空 时 ， 那 什么 时 候 栈 满 呢 ? 


想 想 极端 的 情况 ， 者 栈 2 是 空 栈 ， 栈 1 的 top1 等 于 n-1 时 ， 就 是 栈 1 满 了 。 
反之 ， 当 栈 1 为 空 栈 时 ，top2 等 于 0 时 ， 为 栈 2 满 。 但 更 多 的 情况 ， 其 实 
就 是 我 刚才 说 的 ， 两 个 栈 见 面 之 时 ， 也 就 是 两 个 指针 之 间 相 其 1 时 ， 即 
top1+1==top2 为 栈 满 。 


两 栈 共享 空间 的 结构 的 代码 如 下 : 


/* 两 栈 共享 空间 结构 */ 


typedef struct 


{ 
SElemType data[MAXSIZE]; 
int top1; /* 栈 1 栈 顶 指针 */ 
int top2; /* 栈 2 栈 顶 指针 */ 


} SqDoubleStack; 


对 于 两 栈 共享 空间 的 push 方 法 ， 我 们 除了 要 插入 元 素 值 参数 外 ， 还 需 
一 个 判断 是 栈 1 还 是 栈 2 的 栈 号 参数 stackNumber。 插 入 元 素 的 代码 
ΠΡ. 


/* 插入 元 素 e 为 新 的 栈 顶 元 素 */ 


Status Push(SqDoubleStack *S, SElemType e, 


int stackNumber ) 


a 
/* 栈 已 满 ， 不 能 再 push 新 元 素 了 */ 
(OI) 
return ERROR; 
/* 栈 1 有 元 素 进 栈 */ 
if (stackNumber == 1) 
/* 若 栈 1 则 先 top1+1 后 给 数组 元 素 赋值 */ 
S->data[++S->top1] = e; 
/* 栈 2 有 元 素 进 栈 */ 
else if (stackNumber == 2) 
/* 若 栈 2 则 先 top2-1 后 给 数组 元 素 赋值 */ 
S->data[--S->top2] = e; 
return OK; 
} 


因为 在 开始 已 经 判断 了 是 否 有 栈 满 的 情况 ， 所 以 后 面 的 top1+1 或 top2-1 
征 不 担心 溢出 问题 的 。 


对 于 两 栈 共享 空间 的 pop 方 法 ， 参 数 就 只 是 判断 栈 1 栈 2 的 参数 
stackNumber， 代 码 如 下 : 


/* 若 栈 不 空 ， 则 删除 S 的 栈 顶 元 素 ， 用 e 返 回 其 值 ， 


返回 OK; 否则 返回 ERROR */ 


Status Pop(SqDoubleStack *S, SElemType *e, int stackNumber) 


if (stackNumber == 1) 
{ 


/* 说 明 栈 1 已 经 是 空 栈 ， 洪 出 */ 


if (S->top1 == -1) 


return ERROR; 


/* 将 栈 1 的 栈 顶 元 素 出 栈 */ 
*e = S->data[S->topi--]; 
} 
else if (stackNumber == 2) 


/* ΜΒΗΒΙΖΕ AETI, Yat */ 


if (S->top2 == MAXSIZE) 


return ERROR; 


/* 将 栈 2 的 栈 顶 元 素 出 栈 */ 
*e = S->data[S->top2++]; 
} 
return ΟΚ; 


} 


事实 上 ， 使 用 这 样 的 数据 结构 ， 通 常 都 是 当 两 个 栈 的 空间 需求 有 相反 
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一 样 ， 你 天 入 时 ， 一 定 是 有 一 个 你 不 知道 的 人 在 做 卖 出 操作 。 有 人 赚 
钱 ， 束 一 定 是 有 人 赔钱 。 这 样 使 用 两 栈 共享 空间 存储 方法 才 有 比较 大 
的 意义 。 否 则 两 个 栈 都 在 不 停 地 增长 ， 那 很 快 就 会 因 栈 满 而 次 出 了 。 


当然 ， 这 只 古 针 对 两 个 具有 相同 数据 类 型 的 栈 的 一 个 设计 上 的 技巧 ， 
如 和 东 坪 不 相同 数据 类 型 的 栈 ， 这 种 办 法 不 但 不 能 更 好 地 处 理 问 题 ， 反 
会 使 问题 变 得 更 复杂 ， 大 家 要 注意 这 个 前 提 。 

4.6 ” 栈 的 链 式 存储 结构 及 实现 

4.6.1 ” 栈 的 链 式 存储 结构 


0 ΞΔ Δ Δὄζσς.--. ;; 


TER 


想 想 看 ， 栈 只 是 栈 顶 来 做 插入 和 删除 操作 ， 栈 顶 放 在 链表 的 头 部 还 是 
尾部 呢 ? 由 于 单 链表 有 头 指针 ， 而 栈 顶 指针 也 是 必须 的 ， 那 干吗 不 让 
它 俩 合 二 为 一 呢 ， 所 以 比较 好 的 办 法 是 把 栈 顶 放 在 单 链表 的 头 部 (如 
图 4-6-1 所 示 ) 。 男 外 ， 都 已 经 有 了 栈 顶 在 头 部 了 ， 单 链表 中 比较 常用 
的 头 结 点 也 就 失去 了 和 意义， 通常 对 于 链 栈 来 说 ， 有 是 不 需要 头 结 点 的 。 


图 4-6-1 

对 于 链 栈 来 说 ， 基 本 不 存在 栈 满 的 情况 ， 除 非 内 存 已 经 没有 可 以 使 用 
的 空间 ， 如 果真 的 发 生 ， 那 此 时 的 计算 机 操作 系统 已 经 面临 死机 崩溃 
的 情况 ， 而 不 是 这 个 链 栈 是 否 溢 出 的 问题 。 


但 对 于 空 栈 来 说 ， 链 表 原 定义 是 头 指 针 指 向 空 ， 那 么 链 栈 的 空 其 实 就 
是 top=NULL 的 上 时候。 


链 栈 的 结构 代码 如 下 : 


typedef struct StackNode 
i 

SElemType data; 

struct StackNode *next; 
} StackNode, *LinkStackPtr; 
typedef struct LinkStack 
{ 

LinkStackPtr top; 

int count; 


} LinkStack; 


PRIR TPA ABT PAN Βα REA, 只 是 在 插入 和 删除 上 ， 特 殊 一 


4.6.2 ” 栈 的 链 式 存储 结构 一 一 进 栈 操作 


对 于 链 栈 的 进 栈 push 操 作 ， 假 设 元 素 值 为 e 的 新 结 点 是 s，top 为 栈 顶 指 
针 ， 示 意图 如 图 4-6-2 所 示 代 码 如 下 。 


| 4-6-2 


/* 插入 元 素 e 为 新 的 栈 顶 元 素 */ 


Status Push(LinkStack *S, SElemType e) 


ne 
LinkStackPtr s 
= (LinkStackPtr )malloc(sizeof(StackNode) ); 
s->data = e; 
/* 把 当前 的 栈 顶 元 素 赋值 给 新 结 点 的 直接 后 继 ， 如 图 中 GD */ 
s->next = S->top; 
/* 将 新 的 结 点 Ss 赋 值 给 栈 顶 指针 ， 如 图 中 CD */ 
S->top = S; 
S->count++; 
return OK; 
} 


4.6.3 ” 栈 的 链 式 存储 结构 一 一 出 栈 操作 


至 于 链 栈 的 出 栈 pop 操 作 ， 也 是 很 简单 的 三 名 操作 。 假 设 变 量 p 用 来 存 
将 栈 顶 指针 下 移 一 位 ， 最 后 释放 p 即 可 ， 如 图 4- 
6-3ΡΤ7 5 


| 4-6-3 


/* 若 栈 不 空 ， 则 删除 S 的 栈 顶 元 素 ， 用 e 返 回 其 值 ， 


返回 OK; 否则 返回 ERROR */ 


Status Pop(LinkStack “5, ΘΕΙΕΠΤΥΡ *e) 
LinkStackPtr p; 
if (StackEmpty(*S)) 
return ERROR; 


*e = S->top->data; 


/* 将 栈 顶 结 点 赋值 给 p， 如 图 @) */ 


p = S->top; 


/* 使 得 栈 顶 指针 下 移 一 位 ， 指 向 后 一 结 点 ， 如 图 由 */ 


S->top = S->top->next; 
/* 释放 结 点 p */ 
ES 

S->count--; 

return OK; 


} 


链 栈 的 进 栈 push 和 出 栈 pop 操 作 都 很 简单 ， 没 有 任何 循环 操作 ， 时 间 复 
洒 度 均 为 O(1)。 


对 比 一 下 顺序 栈 与 链 栈 ， 它 们 在 时 间 复 杂 度 上 是 一 样 的 ， 均 为 0(1D)。 
对 于 空间 性 能 ， 顺 序 栈 需 要 事先 确定 一 个 固定 的 长 度 ， 可 能 会 存在 内 
存 空间 溉 费 的 问题 ， 但 它 的 优势 是 存 取 时 定位 很 方便 ， 而 链 栈 则 要 求 
每 个 元 素 都 有 指针 域 ， 这 同时 也 增加 了 一 些 内 存 开销 ， 但 对 于 栈 的 长 
度 无 限制 。 所 以 它们 的 区 别 和 线性 表 中 讨论 的 一 样 ， 如 果 栈 的 使 用 过 
程 中 元 素 变 化 不 可 预料 ， 有 时 很 小 ， 有 了 时 非常 大 ， 那 么 最 好 古 用 链 
栈 ， 反 之 ， 如 果 它 的 变化 在 可 欣 范 围 内 ， 建 议 使 用 顺序 栈 会 更 好 一 


此 ο 


4.7 RAVER 


有 的 同学 可 能 会 觉得 ， 用 数组 或 链表 直接 实现 功能 不 就 行 了 吗 ? 干吗 
要 引入 栈 这 样 的 数据 结构 呢 ? 这 个 问题 问 得 好 。 


其 实 这 和 我 们 明明 有 两 只 脚 可 以 走路 ， 干 吗 还 要 乘 汽 车 、 火 车 、 飞 机 
一 样 。 理 论 上 ， 陆 地 上 的 任何 地 方 ， 你 都 是 可 以 徘 双 脚 走 到 的 ， 可 那 
需要 多 少时 间 和 精力 呢 ? 我 们 更 关注 的 是 到 达 而 不 是 如 何 去 的 过 程 。 


栈 的 引入 人 简化 了 程序 设计 的 问题 ， 划 分 了 不 同 关注 层次 ， 使 得 思考 范 
围 缩小 ， 更 加 案 焦 于 我 们 要 解决 的 问题 核心 。 反 之 ， 像 数组 等 ， 因 为 
要 分 散 精 力 去 考虑 数组 的 下 标 增 减 等 细节 问题 ， 反 而 掩盖 了 问题 的 本 


质 


所 以 现在 的 许多 高 级 语言 ， 比 如 Java、C# 等 都 有 对 栈 结构 的 封装 ， 你 
ο αν a to 
常 : 


4.8” 栈 的 应 用 一 一 递归 


栈 有 一 个 很 重要 的 应 用 :在 程序 设计 语言 中 实现 了 递归 。 那 么 什么 是 
递归 呢 ? 


当 你 往 镜子 前 面 一 站 ， 锐 子 里 面 就 有 一 个 你 的 像 。 但 你 试 过 两 面 镜子 
一 起 照 吗 ? 如果 A、B 两 面 镜子 相互 面对面 放 着 ， 你 往 中 间 一 站 ， 嘿 ， 
两 面 镜子 里 都 有 你 的 千 百 个 “化 身 ”。 为 什么 会 有 这 么 奇妙 的 现象 呢 ? 
原来 ，A 镜 子 里 有 B 镜 子 的 像 ，B 镜 子 里 也 有 A 镜 子 的 像 ， 这 样 反 反复 
复 ， 束 会 产生 一 连 串 的 “ 像 中 像 *。 这 是 一 种 递归 现象 ， 如 图 4-8-1 所 
ZR 5 


图 4-8-1 


我 们 先 来 看 一 个 经 典 的 递归 例子 : 斐 波 那 契 数列 (Fibonacci) ° AS 
说 明 这 个 数列 ， 这 位 斐 老 还 举 了 一 个 很 形象 的 例子 。 


4.8.1 斐 波 那 契 数列 实现 


说 如 果 人 兔子 在 出 生 两 个 月 后 ， 就 有 繁殖 能 力 ， 一 对 人 兔子 每 个 月 能 生出 
= ο ο 那么 一 年 以 后 可 以 党 殖 多 少 对 免 
WE 


我 们 拿 新 出 生 的 一 对 小 兔子 分 析 一 下 : 第 一 个 月 小 兔子 没有 繁殖 能 
力 ， 所 以 还 是 一 对 ; 两 个 月 后 ， 生 下 一 对 小 兔子 数 共 有 两 对 ; 三 个 月 
以 后 ， 老 儿子 又 生 下 一 对 ， 因 为 小 鬼子 还 没有 楷 殖 能 力 ， 所 以 一 共和 是 
三 对 ..…… 依 次 类 推 可 以 列 出 下 表 〈 表 4-8-1) 。 


表 4-8-1 


表 中 数字 1，1，2，3，5，8，13...... 构 成 了 一 个 序列 。 这 个 数列 有 个 
TE ὦ, 6Έὄ,-Δ--Ξ-Ἐ-;: 
2 所 示 。 


图 4-8-2 


可 以 发 现 ， 编 号 的 一 对 兔子 经 过 六 个 月 就 变 成 8 对 兔子 了 。 如 果 我 们 
用 数学 函数 来 定义 束 忌 : 


“n=0 
Fin)=41, Bn= 
Fin-1)+Fin-2), 4n>1 


EBF, A EBA SBI YT FILER A HAT 
πο ο HA a0 (THEE RL © FOABAU Τὶ 


int main() 
{ 
προς 
int a[40]; 
a[0] = 0; 
8[1] = 1; 
printf("%d ", a[Q]); 
Praner Gd rales 
for (i = 2; i < 40; i++) 
ή 
ο ορ ο αλ 
printf("%d ", a[i]); 
} 


return 0; 


代码 很 商 单 ， 几 乎 不 用 做 什么 解释 。 但 其 实 我 们 的 代码 ， 如 采用 递归 
来 实现 ， 还 可 以 更 简单 。 


/* 斐 波 那 契 的 递归 函数 */ 


Yr 


int Fbi(int i) 


g 
CE ο) 
return i = 0 ? O : 1; 
/* 这 里 Fbi 就 是 钞 数 自己 ， 它 在 调 ΠΕ 


return EDLE eb 2 


} 
int main() 
{ 

ΠΠ; 


for (i = 0; i < 40; i++) 
peame (Goda (的 可 由 
return 0; 


} 


AR, HEROSA, EDERE TAM, NWR 
fe Bt I 5 


函数 怎么 可 以 目 己 调用 目 己 ? 听 起 来 有 些 难以 理解 ， 不 过 你 可 以 不 要 
把 一 个 递归 函数 中 调用 目 己 的 函数 看 作 是 在 调用 目 己 ， 而 束 当 它 古 在 
调 男 一 个 钞 数 。 只 不 过 ， 这 个 函数 和 目 己 长 得 一 样 而 已 。 


我 们 来 模拟 代码 中 的 FbiG) 函 数 当 i=5 的 执行 过 程 ， 如 图 4-8-3 所 示 。 


Foi(3}+Fb(2}+ Fbi(2)+Fbi( F 
sang 
(η 
πα, 
ΙΡ Slee 


| 
+] = 

! 

| 


3 


图 4-8-3 
4.8.2 ”递归 定义 


在 高 级 语言 中 ， 调 用 目 己 和 其 他 函数 并 没有 本 质 的 不 同 。 我 们 把 一 个 
ΙΙ AVA Val A va A TA ΒΕΛΗ AEN, PK 
J5 


当然 ， EVET TARA RIT ΙΑ Β 
个 递归 定义 必须 至 少 有 一 个 条 件 ， 满 足 时 着 归 不 再 进行 ， 即 不 再 引用 
目 身 而 是 返回 值 退出 。 比 如 刚才 的 例子 ， 总 有 一 次 递归 会 使 得 i<2 的 ， 
这 样 束 可 以 执行 retum i 的 语句 而 不 用 继续 递归 了 ο 


AY EET BA SESE ERABI ICES ο TATA BUFR Sle: TATE ALE 
是 循环 结构 ， 递 归 使 用 的 是 选择 结构 。 递 归 能 使 程序 的 结构 更 清晰 、 
更 简 浪 、 更 容易 让 人 理解 ， 从 而 减少 读 慌 代码 的 时 间 。 但 是 大 量 的 弟 
归 调 用 会 建立 函数 的 副本 ， 会 耗费 大 量 的 时 间 和 内 存 。 送 代 则 不 需要 
反复 调用 函数 和 占用 额外 的 内 存 。 因 此 我 们 应 该 视 不 同情 况 选 择 不 同 

的 代码 实现 方式 。 


那么 我 们 讲 了 这 么 多 递归 的 内 容 ， 和 栈 有 什么 关系 呢 ? 这 得 从 计算 机 
系统 的 内 部 说 起 ο 


前 面 我 们 已 经 看 到 递归 是 如 何 执行 它 的 前 行 和 退回 阶段 的 。 递 归 过 程 
退回 的 顺序 是 它 前 行 顺序 的 逆序 。 在 退回 过 程 中 ， 可 能 要 执行 某 些 动 
作 ， 包 括 恢 复 在 前 行 过 程 中 存储 起 来 的 某 些 数据 。 


这 种 存储 某 些 数据 ， 并 在 后 面 又 以 存储 的 逆序 恢复 这 些 数 据 ， 以 提供 
之 后 使 用 的 需求 ， 显 然 很 符合 栈 这 样 的 数据 结构 ， 因 此 ， 编 译 右 使 用 
栈 实现 递归 就 没什么 好 惊讶 的 了 。 


简单 的 说 ， 束 是 在 前 行 阶段 ， 对 于 每 一 层 递归 ， 函 数 的 局 部 变量 、 参 
数值 以 及 返回 地 址 都 被 压 入 栈 中 。 在 退回 阶段 ， 位 于 栈 顶 的 局 部 变 
量 、 参 数值 和 返回 地 址 被 弹出 ， 用 于 返回 调用 层次 中 执行 代码 的 其 余 
部 分 ， 也 就 是 恢复 了 调用 的 状态 。 


当然 ， 对 于 现在 的 高 级 语言 ， 这 样 的 递归 问题 是 不 需要 用 户 来 管理 这 
个 栈 的 ， 一切 痢 由 系统 代劳 了 。 


4.9 ” 栈 的 应 用 一 一 四 则 运算 表达 式 求 值 
4.9.1 后 级 (ΝΞ) 表示 法 定义 


栈 的 现实 应 用 也 很 多 ， 我 们 再 来 重点 讲 一 个 比较 第 见 的 应 用 : 数学 表 
达 式 的 求 值 。 


我 们 小 学 学 数学 的 上 时候， 有 一 句 话 是 老师 反复 强调 的 ,“ 先 乘除 ， 后 加 
诚 ， 从 左 算 到 右 ， 先 括号 内 后 括号 外 ”。 这 个 大 家 都 不 陌生 。 我 记得 我 
小 时 候 ， 天 天 做 这 种 加 减 乘除 的 数学 作业 ， 很 烦 ， 于 是 就 偷偷 拿 了 老 
爸 的 计算 器 来 帮 着 算 答案 ， 对 于 单纯 的 两 个 数 的 加 减 乘除 ， 的 确 是 省 
心 不 少 ， 我 也 因此 潇洒 了 一 两 年 。 可 后 来 要 求 要 加 减 乘 除 ， 甚 至 还 有 
带 有 大 中 小 括号 的 四 则 运算 ， 我 发 现 老 爸 那 个 简陋 的 计算 器 不 好 使 
了 。 比 如 9+(3-TDx3+10:2， 这 是 一 个 非常 简单 的 题目 ， 心 算 也 可 以 很 快 
算出 是 20。 可 就 这 么 简单 的 题目 ， 计 算 器 却 不 能 在 一 次 输入 后 马上 得 
出 结果 ， 很 是 不 方便 。 

当然 ， 后 来 出 的 计算 器 就 高 级 多 了 ， 它 引入 了 四 则 运算 表达 式 的 概 


念 ， 也 可 以 输入 括号 了 ， 所 以 现在 的 00 后 的 小 朋友 们 ， 更 加 可 以 从 
懒 、 抄 近 路 做 数学 作业 了 。 


那么 在 新 式 计算 器 中 或 者 计算 机 中 ， 它 是 如 何 实现 的 呢 ? 如 果 让 你 用 C 
语言 或 其 他 高 级 语言 实现 对 数学 表达 式 的 求 值 ， 你 打算 如 何 做 ? 


这 里 面 的 困难 束 在 于 乘除 在 加 减 的 后 面 ， 却 要 先 运算 ， 而 加 入 了 括号 
后 ， 束 变 得 更 加 复杂 。 不 知道 该 如 何 处 理 。 


(AA eA, fa See AO MA, AAS ESA Ata 
F, HTE, RA SSCS LACH 5 ARMIES 
适 ， 只 要 磁 到 左 括号 ， 丈 将 此 左 括号 进 栈 ， 不 管 表 达 式 有 和 多少 重 括 
F, 反正 过 到 左 括号 束 进 栈 ， 而 后 面 出 现 右 括号 时 ， 束 让 栈 顶 的 左 括 
号 出 栈 ， 期 间 让 数字 运算 ， 这 样 ， 最 终 有 括号 的 表达 式 从 左 到 右 巡 查 
一 笛 ， 栈 应 该 是 由 空 到 有 元 素 ， 最 终 再 因 全 部 匹配 成 功 后 成 为 空 栈 。 


但 对 于 四 则 运算 ， 括 号 也 只 是 当中 的 一 部 分 ， 先 乘除 后 加 减 使 得 问题 
BORA, 如 何 有 效 地 处 理 它们 呢 ? 我 们 伟大 的 科学 家 想到 了 好 办 
法 。 


20 世 纪 50 年 代 ， 波 兰 逻 辑 学 家 Jan-ukasiewicz， 当 时 也 和 我 们 现在 的 同 
学 们 一 样 ， 困 惑 于 如 何 才 可 以 搞定 这 个 四 则 运算 ， 不 知道 他 是 否 也 像 
牛顿 被 阐 果 砸 到 头 而 想到 万 有 引力 的 原理 ， 或 者 还 是 阿 基 米 德 在 洽 缸 
中 洗澡 时 想到 判断 皇冠 是 否 纯 金 的 办 法 ， 总 之 他 也 是 灵感 突现 ， 想 到 
了 一 种 不 需要 括号 的 后 级 表达 法 ， 我 们 也 把 它 称 为 近 波 兰 (Reverse 
Polish Notation, RPN) 表示 。 我 想 可 能 是 他 的 名 字 太 复杂 了 ， 所 以 后 
人 只 用 他 的 国籍 而 不 是 姓名 来 命名 ， 实 在 可 惜 。 这 也 告诉 我 们 ， 想 要 
流芳 百世 ， 名 字 还 要 起 得 朗 衣 上 口才 行 。 这 种 后 缀 表示 法 ， 是 表达 式 
的 一 种 新 的 显示 方式 ， 非 常 巧 妙 地 解决 了 程序 实现 四 则 运算 的 难题 。 
我 们 先 来 看 看 ， 对 于 “9+(3-1)x3+10=-2”， 如 果 要 用 后 级 表示 法 应 该 是 什 
么 样子 : “9 3 1-3*+102/+”， 这 样 的 表达 式 称 为 后 级 表 达 式 ， 叫 后 缀 的 
原因 在 于 所 有 的 符号 都 是 在 要 运算 数字 的 后 面 出 现 。 显 然 ， 这 里 没有 
了 括号 。 对 于 从 来 没有 接触 过 后 绥 表 达 式 的 同学 来 讲 ， 这 样 的 表述 是 
很 难受 的 。 不 过 你 不 喜欢 ， 有 机 器 喜 欢 ， 比 如 我 们 聪明 的 计算 机 。 


4.9.2 ”后 缀 表达 式 计算 结果 


为 了 解释 后 级 表达 式 的 好 处 ， 我 们 先 来 看 看 ， 计 算 机 如 何 应 用 后 缀 表 
达 式 计算 出 最 终 的 结果 20 的 。 


RRA: 9 3 1-3*+10 2/+ 


ΑΠ. ACB HAS ERS, EE ERR, 
遇 到 是 符号 ， 就 将 处 于 栈 顶 两 个 数字 出 栈 ， 进 行 运算 ， 运 算 结果 进 
栈 ， 一 直到 最 终 获得 结果 。 


1. 初始 化 一 个 空 栈 。 此 栈 用 来 对 要 运算 的 数 子 进出 使 用 。 如 图 4-9-1 的 
ARMI. 


2. 后 缀 表达 式 中 前 三 个 部 是 数字 ， 所 以 9、3、1 进 栈 ， 如 图 4-9-1 的 右 
图 所 示 。 


[1 ΓΞ 
O. f= 
πα πα 
D i 
„O κα 


3. de PR”, POC Re AIMEE, SHEA BOREL, 2 
运算 3-1 得 天 2， 再 将 2 进 栈 ， 如 图 4-9-2 的 左 图 所 示 。 


4. 接着 是 数 子 3 进 栈 ， 如 图 4-9-2 的 右 图 所 示 。 


4-9-2 


5. 后 面 是 “*”， 也 就 意味 着 栈 中 3 和 2 出 栈 ，2 与 3 相 乘 ， 得 到 6， 并 将 6 
进 栈 ， 如 图 4-9-3 的 左 图 所 示 。 


6. 下 面 是 “+”， 所 以 栈 中 6 和 9 出 栈 ，9 与 6 相 加 ， 得 到 15， 将 15 进 栈 ， 
如 图 4-9-3 的 右 图 所 示 。 


图 4-9-3 
7. 接着 是 10 与 2 两 数字 进 栈 ， 如 图 4-9-4 的 左 图 所 示 。 


8. 接 下 来 是 符号 “”， 因 此 ， 栈 顶 的 2 与 10 出 栈 ，10 与 2 相 除 ， 得 到 5， 
将 5 进 栈 ， 如 图 4-9-4 的 右 图 所 示 。 


图 4-9-4 

9. 最 后 一 个 是 符号 “+”， 所 以 15 与 5 出 栈 并 相 加 ， 得 到 20， 将 20 进 栈 ， 
如 图 4-9-5 的 左 图 所 示 。10.， 结果 是 20 出 栈 ， 栈 变 为 空 ， 如 图 4-9-5 的 右 
图 所 示 。 


] ] 
to 
Fe i 20 0 
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图 4-9-5 


果然 ， 后 绥 表 达 法 可 以 很 顺利 解决 计算 的 问题 。 现 在 除了 睡觉 的 同 
学 ， 应 该 都 有 同样 的 疑问 ， 束 是 这 个 后 缀 表达 式 “9 3 1-3 +10 2/+ ”在 您 
Δ RRI? 1Χ TILE, “ΗΝ ο ΒΓΙ Pit, RhA 
HE FUIPTLL “9 + (3-1) x3 +1022” 12/49 3 1-3 +10 2/+” 9 


49.3 ”中 缀 表达 式 转 后 级 表达 式 

我 们 把 平时 所 用 的 标准 四 则 运算 表达 式 ， 即 “9+(3-1)x3+10=2” 叫 做 中 级 
表达 式 。 因 为 所 有 的 运算 符号 都 在 两 数字 的 中 间 ， 现 在 我 们 的 问题 就 
是 中 级 到 后 缀 的 转化 。 

中 缀 表达 式 “9+(3-1)x3+10-=2” 转 化 为 后 缀 表达 式 “9 3 1-3*+10 2/+”。 


规则 : 从 左 到 右 训 历 中 级 表达 式 的 每 个 数字 和 符号 ， 夺 是 数字 束 输 
出 ， 即 成 为 后 级 表达 式 的 一 部 分 ， 夺 是 从 号， 则 判断 其 与 栈 顶 符号 的 


优先 级 ， 是 右 括 号 或 优先 级 不 高 于 栈 顶 符号 (乘除 优先 加 减 ， 则 栈 顶 
ΙΓ FEES TT Ια, — EE RAA a IA 
工 x ο 
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给 出 : 无 给 出 ,9 
9-6 


2， 第 一 个 字符 是 数字 9， 输 出 9， 后 面 是 符号 “+”， 进 栈 。 如 图 4-9-6 的 
右 图 所 示 。 


3. 第 三 个 字符 是 “(”， 依 然 是 符号 ， 因 其 只 是 左 括号 ， 还 未 配对 ， 故 进 
栈 。 如 图 4.9.7 的 左 图 所 示 。 


4. 第 四 个 字符 是 数字 3， 输 出 ， 总 表达 式 为 93， 接 着 是 “<-”， 进 栈 。 如 
图 4-9-7 的 右 图 


图 4-9-7 


5. 接 下 来 是 数字 1， 输 出 ， 总 表达 式 为 931， 后 面 是 符号 “)”， 此 时 ， 

我 们 需要 去 匹配 此 前 的 “(*， 所 以 栈 顶 依次 出 栈 ， 并 输出 ， 直 到 “(”* 出 栈 
为 止 。 此 时 左 括 号 上 方 只 有 “-”， 因 此 输出 “-”。 总 的 输出 表达 式 为 93 
1-。 如 图 4-9-8 的 左 图 所 示 。 

6. 紧 接 着 是 符号 “x”， 因 为 此 时 的 栈 顶 符号 为 “<+” 号 ， 优 先 级 低 于 “x”， 
因此 不 输出 ，“*” 进 栈 。 接 着 是 数字 3， 输 出 ， 总 的 表达 式 为 93 1-3。 

如 图 4-9-8 的 右 图 所 示 。 


| 4-9-8 


7. 之 后 是 符号 <t>， 此 时 当前 栈 顶 元 素 " AANA MEERA, A 
REET REI (BEATE +” GERIEER, Αμ ΗΗΙ 
18), BAM BIA TCH 3 1-3 +。 然 后 将 当前 这 个 符号 <+* 进 栈 。 也 就 
是 说 ， 前 6 张 图 的 栈 底 的 "+ 是 指 中 组 表达 式 中 开头 的 9 后 面 那个 cr”， 
而 图 4-9-9 左 图 中 的 栈 底 (也 是 栈 顶 ) 的 “+" 是 指 <9+(3-D)x3+? 中 的 最 后 


AND a 


8， 紧 接着 数字 10， 输 出 ， 总 表达 式 变 为 9 31-3*+10。 后 是 符号 “”， 所 
以 “/” 进 栈 。 如 图 4-9-9 的 右 图 所 示 。 


输出 , 931 - 3*+ 输出 . 931 - 33-10 


图 4-9-9 


9. 最 后 一 个 数字 2， 输 出 ， 总 的 表达 式 为 9 31-3 +102 ο ΠΗΕ4-9- 1047 
ARR «10. ALR, PUR PITS EHR eS HH ο Ἐκ 
ZR tr HAG EIA StF F N93 1-3 +10 2/+。 如 图 4-9-10 的 右 图 所 示 。 


top 
HH: 931 -3*+102 ”输出 ; 931 - 3*+102/+ 


图 4-9-10 

从 刚才 的 推导 中 你 会 发 现 ， 要 想 让 计算 机 具有 处 理 我 们 通常 的 标准 
CHA) 表达 式 的 能 力 ， 最 重要 的 就 是 两 步 ， 1. 将 中 组 表达 式 转化 为 
MARAA 〈 栈 用 来 进出 运算 的 符号 ) 。 2. 将 后 缀 表达 式 进行 运算 得 
出 结果 〈 栈 用 来 进出 运算 的 数字 ) 。 


整个 过 程 ， 都 充分 利用 了 栈 的 后 进 爷 出 特性 来 处 理 ， 理 解 好 它 其 实 也 
整理 解 好 了 栈 这 个 数据 结构 。 


GT, (KAR, 一 会 儿 我 们 继续 ， 接 下 来 会 讲 队 列 。 
4.10 ”队列 的 定义 


你 们 在 用 电脑 时 有 没有 经 历 过 ， 机 器 有 时 会 处 于 疑似 死机 的 状态 ， 鼠 
标点 什么 似乎 都 没 用 ， 双 击 任何 快捷 方式 都 不 动弹 。 残 当 你 失去 而 


心 ， 打 算 reset 时 。 突 然 它 像 酒 醒 了 一 样 ， 把 你 刚才 点击 的 所 有 操作 全 
部 都 按 顺 序 执行 了 一 迄 。 这 其 实 是 因为 操作 系统 中 的 多 个 程序 因 需 要 
通过 一 个 通道 输出 ， 而 按 先 后 次 序 排队 等 待 造成 的 。 


再 比如 像 移动 、 联 通 、 电 信 等 客服 电话 ， 客 服 人 员 与 客户 相 比 总 是 少 
ὮΝ, EMAAR a ANE, BAAR KS, BENG 
某 个 客服 人 员 空 下 来 ， 才 能 让 最 移 等 待 的 客户 搂 通 电话 。 这 里 也 坪 将 
所 有 当前 拨打 客服 电话 的 客户 进行 了 排队 处 理 。 


操作 系统 和 客服 系统 中 ， 部 是 应 用 了 一 种 数据 结构 来 实现 刚才 提 到 的 
先进 移出 的 排队 功能 ， 这 融 是 队列 。 


队列 (queue) 是 只 允许 在 一 端 进行 插入 操作 ， 而 在 另 一 端 进行 删除 操 
作 的 线性 表 。 


队列 是 一 种 先进 先 出 (First In First Out) 的 线性 表 ， 简 称 FIFO。 人 允许 

插入 的 一 端 称 为 队 尾 ， 人 允许 删除 的 一 端 称 为 队 头 。 假 设 队 列 是 q=(ai ,a 
-- an) Mha 就 是 队 头 元 素 ， 而 a, 是 队 尾 元 素 。 这 样 我 们 就 可 以 

删除 时 ， 总 是 从 ai; 开始 ， 而 揪 入 时 ， 列 在 最 后 。 这 也 比较 符合 我 们 通 

常生 活 中 的 习惯 ， 排 在 第 一 个 的 优先 出 列 ， 最 后 来 的 当然 排 在 队伍 最 

后 ， 如 图 4-10-1 所 示 。 


图 4-10-1 


队列 在 程序 设计 中 用 得 非常 频繁 。 前 面 我 们 已 经 举 了 两 个 例子 ， 再 比 
如 用 键盘 进行 各 种 字母 或 数字 的 输入 ， 到 显示 天 上 如 记事 本 软件 上 的 


输出 ， 其 实 就 是 队列 的 典型 应 用 ， 假 如 你 本 来 和 女友 聊天 ， 想 表达 你 
是 我 的 上 帝 ， 输 入 的 是 god， 而 屏幕 上 却 显示 出 了 dog 发 了 出 去 ， 这 真 
是 要 气 死 人 了 。 


4.11 队列 的 抽象 数据 类 型 


同样 是 线性 表 ， 队 列 也 有 类 似 线性 表 的 各 种 操作 ， 不 同 的 就 是 插入 数 
据 只 能 在 队 尾 进 行 ， 删 除数 据 只 能 在 队 头 进行 。 


ADT 队列 (Queue) 


Data 


同 线性 表 。 元 素 具 有 相同 的 类 型 ， 相 邻 元 素 具 有 前 驱 和 后 继 关 系 。 


Operation 


InitQueue(*Q): 初始 化 操作 ， 建 立 一 个 空 队 列 Q 9 


DestroyQueue(*Q): 若 队列 Q 存 在 ， 则 销毁 它 。 
将 


ο 


ClearQueue(*Q): 队列 Q 清 空 。 


τα 


大 列 Q 为 空 ， 返 回 true， 否 则 返回 false 9 


QueueEmpty(Q): 


aay 
GetHead(Q, *e): ， 若 队 列 Q 存 在 且 非 空 ， 用 e 返 回 队 列 Q 的 队 头 元 素 。 
若 


τα 


EnQueue(*Q, e): 从 列 Q 存 在 ， 揪 入 新 元 素 e 到 队列 Q 中 并 成 为 队 尾 元 素 。 


DeQueue(*Q, *e): 删除 队列 中队 头 元 素 ， e 返 回 其 值 。 
QueueLength(Q): ”返回 队列 Q 的 元 素 个 数 
endADT 


4.12 ”循环 队列 

线性 表 有 顺序 存储 和 链 式 存储 ， 栈 是 线性 表 ， 所 以 有 这 两 种 存储 方 
式 。 同 样 ， 队 列 作为 一 种 特殊 的 线性 表 ， 也 同样 存在 这 两 种 存储 方 
式 。 我 们 先 来 看 队列 的 顺序 存储 结构 5 

4.12.1 队列 顺序 存储 的 不 足 


我 们 假设 一 个 队列 有 n 个 元 素 ， 则 顺序 存储 的 队列 需 建立 一 个 大 于 n 的 
数组 ， 并 把 队列 的 所 有 元 于 存储 在 数组 的 前 n 个 单元 ， 数 组 下 标 为 0 的 


Μπ BU BA SK ο 所谓 的 入 队列 操作 ， 其 实 融 是 在 队 尾 追 加 一 个 元 素 ， 
不 需要 移动 任何 元 素 ， 因 此 时 间 复 杂 度 为 0(1)， 如 图 4-12-1 所 示 。 


M0 1 2 3 4 Το 1 2 3 4 


图 4-12-1 


与 栈 不 同 的 是 ， 队 列 元 素 的 出 列 是 在 队 头 ， 即 下 标 为 0 的 位 置 ， 那 也 束 
意味 着 ， 队 列 中 的 所 有 元 素 都 得 加 前 移动 ， 以 保证 队列 的 队 头 ， 也 就 
征 下 标 为 0 的 位 置 不 为 空 ， 此 时 时 间 复 杂 度 为 OOD， 如 图 4-12-2 所 示 。 


ΜΕ KE 
fw iW. 
μ[ Al 
ay ἃ) | ἃν | ἃ HT ἃ) | ᾱ | 4 
O 1 1 3 4 M0 1 1 3 4 
图 4-12-2 


这 里 的 实现 和 线性 表 的 顺序 存储 结构 完全 相同 ， 不 再 详 述 。 


在 现实 中 也 是 如 此 ， 一 群 人 在 排队 买 票 ， 前 面 的 人 天 好 了 离开 ， 后 面 
的 人 就 要 全 部 向 前 一 步 ， 补 上 空位 ， 似 乎 这 也 没什么 不 好 9 


可 有 时 想 想 ， 为 什么 出 队列 时 一 定 要 全 部 移动 呢 ， 如 果 不 去 限制 队列 
的 元 素 必 须 存 储 在 数组 的 前 n 个 单元 这 一 条 件 ， 出 队 的 性 能 吏 会 大 大 增 
加 。 也 就 是 说 ， 队 头 不 需要 一 定 在 下 标 为 0 的 位 置 ， 如 图 4-12-3 所 示 。 


MeO 1 2 3 4 μι 1 2 3 4 


图 4-12-3 


为 了 避免 当 只 有 一 个 元 素 时 ， 队 头 和 队 尾 重合 使 处 理 变 得 麻烦 ， 所 以 
引入 两 个 指针 ，front 指 针 指 同 队 头 元 素 ，rear 指 针 指 同 队 尾 元 系 的 下 一 
es 这 样 当 front 等 于 rear 时 ， 此 队列 不 是 还 剩 一 个 元 素 ， 而 是 空 队 
列 。 

假设 是 长 度 为 5 的 数组 ， 初 始 状态 ， 空 队列 如 图 4-12-4 的 左 图 所 示 ， 
front 与 rear 指 针 均 指向 下 标 为 0 的 位 置 。 然 后 入 队 a1 “82 "85 8}, 
front 指 针 依 然 指 癌 下 标 为 0 位 置 ， 而 rear 指 针 指 癌 下 标 为 4 的 位 置 ， 如 图 
4-12-4 的 右 图 所 示 。 


front rear front rear 


YY ' ' 
aafaa 
T 标 '0 1 2 3 4 TRO 1 2 3 ἡ 


图 4-12-4 


出 队 a1、a， ， 则 front 指 针 指 癌 下 标 为 2 的 位 置 ，rear 不 变 ， 如 图 4-12-5 
的 左 图 所 示 ， 再 入 队 a。， 此 时 front 指 针 不 变 ，rear 指 针 移动 到 数组 之 
Sho ο 数组 之 外 ， 那 将 是 哪里 ? 如 图 4-12-5 的 右 图 所 示 。 


front rear front rear 

' ' ' ' 

afa afas? 
τ 1 1 3 4 0 1 2 3 4 


图 4-12-5 


问题 还 不 止 于 此 。 假 设 这 个 队列 的 总 个 数 不 超过 5 个 ， 但 目前 如 条 接 痢 
入 队 的 话 ， 因 数组 来 尾 元 聚 已 经 占用 ， 再 癌 后 加 ， 束 会 产生 数组 越界 
的 错误 ， 可 实际 上 ， 我 们 的 队列 在 下 标 为 0 和 1 的 地 方 还 是 空 采 的 。 我 
们 把 这 种 现象 叫做 “ 假 汶 出 ”。 


现实 当中 ， 你 上 了 公交 车 ， 发 现 前 排 有 两 个 空 座 位 ， 而 后 排 所 有 座位 
πώ 你 会 怎么 做 ? 立马 下 车 ， 并 对 上 自己 说 ， 后 面 没 座 了 ， 我 
等 下 一 辆 ? 


没有 这 么 笨 的 人 ， 前 面 有 座位 ， 当 然 也 是 可 以 坐 的 ， 除 非 坐 满 了 ， 才 
会 考虑 下 一 辆 。 

4.12.2 ”循环 队列 定义 

所 以 解决 假 溢 出 的 办 法 就 是 后 面 满 了 ， 就 再 从 头 开始 ， 也 就 是 头 尾 相 
ο 我 们 把 队列 的 这 种 头 尾 相 接 的 顺序 存储 结构 称 为 循环 队 

J] ο 
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rear front 


πῃ 1 2 3 4 


图 4-12-6 


接着 入 队 as ， 将 它 放 置 于 下 标 为 0 处 ，rear 指 针 指 同 下 标 为 1 处 ， 如 图 4- 
12-7 的 左 图 所 示 。 若 再 入 队 a 7 ， 则 rear 指 针 就 与 front 指 针 重合 ， 同 时 指 
同 下 标 为 2 的 位 置 ， 如 图 4-12-7 的 右 图 所 示 。 


rear front rear front 


图 4-12-7 


ο 此 时 问题 又 出 来 了 ， 我 们 刚才 说 ， 衬 队列 时 ，front 等 于 rear， 现 在 
当 队 列 满 时 ， 也 是 front 等 于 rear， 那 么 如 何 判断 此 时 的 队列 究竟 是 
空 还 是 满 呢 ? 

ο 办 法 一 是 设置 一 个 标志 变量 flag， 当 front==rear， 且 flag=0 时 为 队列 
空 ， 当 front==rear， 且 flag=1 时 为 队列 满 。 

ο 办 法 二 是 当 队 列 空 时 ， 条 件 束 是 front=rear， 当 队列 满 时 ， 我 们 修 
改 其 条 件 ， 保 留 一 个 元 素 空 间 。 也 束 是 说 ， 队 列 满 时 ， 数 组 中 还 
有 一 个 空 内 单元 。 例 如 图 4-12-8 所 示 ， 我 们 就 认为 此 队列 已 经 满 
了 ， 世 就 是 说 ， 我 们 不 允许 图 4-12-7 的 右 图 情况 出 现 。 


front rear rear front 


' ' 


qd 
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图 4-12-8 


我 们 重点 来 讨论 第 二 种 方法 ， 由 于 rear 可 能 比 front 大 ， 也 可 能 比 front 
小 ， 所 以 尽管 它们 只 相差 一 个 位 置 时 就 是 满 的 情况 ， 但 也 可 能 是 相差 
整整 一 图 。 所 以 奋 队 列 的 最 大 尺寸 为 QueueSize， 那 么 队列 满 的 条 件 是 
(rear+1)%QueueSize==front 〈 取 模 “%>” 的 目的 就 是 为 了 整合 rear 与 front 大 
小 为 一 个 问题 ) 。 比 如 上 面 这 个 例子 ，QueueSize=5， 图 4-12-8 的 左 图 
中 front=0， 而 rear=4，(4+1)%5=0， 所 以 此 时 队列 满 。 再 比如 图 4-12-8 
中 的 右 图 ，front=2 而 rear=1°。 (1+1)%5=2， 所 以 此 时 队列 也 是 满 的 。 而 
对 于 图 4-12-6，front=2 而 rear=0，(0+1)%5=1，1z2， 所 以 此 时 队列 并 没 
有 满 。 


男 外 ， 当 rear>front 时 ， 即 图 4-12-4 的 右 图 和 4-12-5 的 左 图 ， 此 时 队列 的 
长 度 为 rear-front。 但 当 rear<front 时 ， 如 图 4-12-6 和 图 4-12-7 的 左 图 ， 队 
列 长 度 分 为 两 段 ， 一 段 是 QueueSize-front， 男 一 段 是 0+rear， 加 在 一 


起 ， 队 列 长 度 为 rear-front+QueueSize。 因 此 通用 的 计算 队列 长 度 公式 
为 : 


(rear-front+QueueSize)%QueueSize 


有 了 这 些 讲解 ， 现 在 实现 循环 队列 的 代码 区 不 难 了 。 
循环 队列 的 顺序 存储 结构 代码 如 下 : 


/* QE1LemType 类 型 根据 实际 情况 而 定 ， 这 里 假设 为 int */ 
typedef int QElemType; 
/* 循环 队列 的 顺序 存储 结构 */ 
typedef struct 
ή 
QElemType data[MAXSIZE]; 
La E 


int front; 


/* 尾 指针 ， 若 队列 不 空 ， 


指向 队列 尾 元 素 的 下 一 个 位 置 */ 


int rear; 


} SqQueue; 


循环 队列 的 初始 化 代码 如 下 : 


{3 ΒΒ ΤΞΕΡΛΖΙΟ 3/ 
Status InitQueue(SqQueue 30) 
{ 

Q->front = 0; 

Q->rear = 0; 


return OK; 


循环 队列 求 队列 长 度 代码 如 下 : 


/* 返回 Q 的 元 素 个 数 ， 也 就 是 队列 的 当前 长 度 */ 


int QueueLength(SqQueue Q) 


{ 


return (Q.rear - Q.front + MAXSIZE) % MAXSIZE; 


循环 队列 的 入 队列 操作 代码 如 下 : 


/* 若 队 列 未 满 ， 则 插入 元 素 e 为 新 的 队 尾 元 素 */ 
Status EnQueue(SqQueue *Q, QElemType e) 


{ 


/* 队列 满 的 判断 */ 
if ((Q->rear + 1) % MAXSIZE == Q->front) 


return ERROR; 


/* 将 元 素 e 赋 值 给 队 尾 */ 
Q->data[Q->rear] = e; 


/* rear 指针 向 后 移 一 位 置 ， */ 


Q->rear = (Q->rear + 1) % MAXSIZE; 


/* 若 到 最 后 则 转 到 数组 头 部 */ 


return OK; 


循环 队列 的 出 队列 操作 代码 如 下 : 


/* 若 队 列 不 空 ， 则 删除 Q 中 队 关 元素， 用 e 返 回 其 值 */ 


Status DeQueue(SqQueue *Q, QElemType *e) 


/* 队列 空 的 判断 3/ 

if (Q->front == Q->rear) 
return ERROR; 

/* 将 队 头 元 素 赋值 给 e */ 

*e = Q->data[Q->front]; 


/* front 指 针 向 后 移 一 位 置 ， */ 


Q->front = (Q->front + 1) % MAXSIZE; 
/* 若 到 最 后 则 转 到 数组 头 部 */ 
return ΟΚ; 


} 
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题 ， 所 以 我 们 还 需要 研究 一 下 不 需要 担心 队列 长 度 的 链 式 存储 结构 。 


4.13 ”队列 的 链 式 存储 结构 及 实现 


队列 的 链 式 存储 结构 ， 其 实 就 古 线 性 表 的 单 链 表 ， 只 不 过 它 只 能 尾 进 
头 出 而 已 ， 我 们 把 它 简 称 为 链 队 列 。 为 了 操作 上 的 方便 ， RITR 
指针 指 回 通 队列 的 头 结 点 ， 而 队 尾 指针 指 同 终端 结 点 ， 如 图 4-13-1 所 
ης 5 


Na i ME 


Tear 


图 4-13-1 
空 队列 时 ，front 和 rear 都 指 癌 头 结 点 ， 如 图 4-13-2 所 示 。 
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链 队 列 的 结构 为 : 


/* QElemType 类 型 根据 实际 情况 而 定 ， 这 里 假设 为 int */ 


typedef int QElemType; 
/* 结 点 结构 */ 
typedef struct QNode 
A 
QElemType data; 
struct QNode *next; 


} QNode, *QueuePtr; 


/* 队列 的 链表 结构 */ 
typedef struct 


{ 


/* AA MEH </ 
QueuePtr front, rear; 


} LinkQueue; 


4.13.1 队列 的 链 式 存储 结构 一 一 入 队 操 作 
入 队 操作 时 ， 其 实 就 是 在 链表 尾部 插入 结 点 ， 如 图 4-13-3 所 示 。 
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图 4-13-3 
其 代码 如 下 : 


/* 插入 元 素 e 为 Q 的 新 的 队 尾 元 素 */ 


Status EnQueue(LinkQueue *Q, QElemType e) 
τ 
QueuePtr s = 


(QueuePtr )malloc(sizeof(QNode) ); 


/* 存储 分 配 失败 */ 
TAGS) 

exit (OVERFLOW); 
s->data = e; 


s->next = NULL; 


/* 把 拥有 元 素 e 新 结 点 $ 赋 值 给 原 队 尾 结 点 的 后 继 ， */ 


Q->rear->next = 5; 


/* 见 上 图 中 四 */ 


/* 把 当前 的 s 设 置 为 队 尾 结 点 ，rear 指 向 Ss， 见 上 图 中 @ */ 


Q->rear = 5; 


return OK; 


4.13.2 ”队列 的 链 式 存 储 结 构 一 出 队 操作 


出 队 操作 时 ， 就 是 头 结 点 的 后 继 结 点 出 队 ， 将 头 结 点 的 后 继 改 为 它 后 
面 的 结 点 ， 帮 链表 除 头 结 点 外 只 剩 一 个 元 素 时 ， 则 需 将 rear 指 向 头 结 
点 ， 如 图 4-13-4 所 示 。 
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图 4-13-4 
代码 如 下 : 


/* 若 队列 不 空 ， 删 除 Q 的 队 头 元 素 ， 用 e 返 回 其 值 ， 


并 返回 OK， 和 否则 返回 ERROR */ 


Status DeQueue(LinkQueue *Q, QElemType 36) 
i 

QueuePtr p; 

if (Q->front == Q->rear) 


return ERROR; 


/将 欲 删除 的 队 头 结 点 暂 存 给 p， 见 上 图 中 加 */ 


p = Q->front->next; 

/* 将 欲 删除 的 队 头 结 点 的 值 赋值 给 e 3/ 

*e = p->data; 

/* 将 原 队 头 结 点 后 继 p->next 赋 值 给 头 结 点 后 继 ， */ 


Q->front->next = p->next; 


/* 见 上 图 中 @ */ 


/* 若 队 头 是 队 尾 ， 则 删除 后 将 rear 指 向 头 结 点 ， 见 上 图 中 @) */ 


if (Q->rear == p) 
Q->rear = Q->front; 

free(p); 

return OK; 


} 


对 于 循环 队列 与 链 队 列 的 比较 ， 可 以 从 两 方面 来 考虑 ， 从 时 间 上 ， 其 
实 它 们 的 基本 操作 都 是 常数 时 间 ， 即 都 为 0() 的 ， 不 过 循环 队列 是 事 
完 申 请 好 空间 ， 使 用 期 间 不 释放 ， 而 对 于 链 队 列 ， 每 次 申请 和 释放 结 
扩 也 会 存在 一 些 时 间 开 销 ， 如 果 入 队 出 队 频 烷 ， 则 两 者 还 是 有 细微 差 
异 。 对 于 空间 上 来 说 ， 循 环 队列 必须 有 一 个 固定 的 长 度 ， 所 以 就 有 了 
存储 元 素 个 数 和 空间 当 费 的 问题 。 而 链 队 列 不 存在 这 个 问题 ， 尽 管 它 
需要 一 个 指针 域 ， 会 产生 一 些 空间 上 的 开销 ， 但 也 可 以 接受 。 所 以 在 
空间 上 ， 链 队列 更 加 灵活 。 


总 的 来 说 ， 在 可 以 确定 队列 长 度 最 大 值 的 情况 下 ， 建 议 用 循环 队列 ， 
如 采 你 无 法 预 估 队列 的 长 度 时 ， 则 用 链 队 列 。 


4.14 ”总 结 回顾 


又 到 了 总 结 回 顾 的 时 间 。 我 们 这 一 章 讲 的 是 栈 和 队列 ， 它 们 都 是 特殊 
的 线性 表 ， 只 不 过 对 插入 和 删除 操作 做 了 限制 。 


栈 (stack) 是 限定 仅 在 表 尾 进行 插入 和 删除 操作 的 线性 表 。 


队列 (queue) 是 只 允许 在 一 端 进行 插入 操作 ， 而 在 另 一 端 进行 删除 操 
作 的 线性 表 ° 


它们 均 可 以 用 线性 表 的 顺序 存储 结构 来 实现 ， 但 都 存在 着 顺序 存储 的 
一 些 弊端 。 因 此 它们 各 目 有 各 目的 技巧 来 解决 这 个 问题 。 

对 于 栈 来 说 ， 如 果 是 两 个 相同 数据 类 型 的 栈 ， 则 可 以 用 数组 的 两 端 作 
ο μα 这 就 可 以 最 大 化 地 利用 数组 的 空 
JE] 5 

对 于 队列 来 说 ， 为 了 避免 数组 插入 和 删除 时 需要 移动 数据 ， 于 是 就 引 
入 了 循环 队列 ， 使 得 以 头 和 队 尾 可 以 在 数组 中 循环 变化 。 解 决 了 移动 
数据 的 时 间 损 耗 ， 使 得 本 来 插入 和 删除 是 O(n) 的 时 间 复 洒 度 变 成 了 
O(1) ° 


它们 也 都 可 以 通过 链 式 存储 结构 来 实现 ， 实 现 原则 上 与 线性 表 基 本 相 
同 如 图 4-14-1 所 示 。 
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图 4-14-1 


4.15 ”结尾 语 


好 了 ， 最 后 两 分 钟 ， 念 几 句 我 在 初学 栈 和 队列 时 写 的 人 生 感悟 的 小 
诗 ， 和 硕 望 也 能 引起 你 们 的 共鸣 。 


人 生 ， 就 像 是 一 个 很 大 的 栈 演变 。 出 生 时 你 赤 条 条 地 来 到 人 世 ， 慢 慢 
地 长 大 ， 渐 渐 地 变 老 ， 最 终 还 得 未 条 条 地 离开 世间 9 


人 生 ， 双 仿佛 是 一 天 一 天 小 小 的 栈 重 现 。 童 年 父母 每 天 抱 你 不 断 地 进 
出 家 | 门 ， 壮 年 你 每 天 奔波 于 家 与 事业 之 间 ， 老 年 你 每 天 独自 噜 路 于 养 
老 院 的 门 里 屋 前 。 


人 生 ， 更 需要 有 进 栈 出 栈 精神 的 体现 。 在 哪里 跌倒 ， 就 应 该 在 哪里 把 
起 来 。 无 论 陷入 何等 困境 ， 只 要 抬头 能 仰望 监 天 ， 就 有 布 谓 ， 不 断 进 
取 ， 你 就 可 以 让 出 头 之 日 重 现 。 困 难 不 会 永远 存在 ， 强 者 才能 勇 往 下 
BI ° 


ΛΞ, SERIE ΤΛΟΛΗΗΡΑΡΙΒΆΣ ο AEF > RARE, ΤΕΙ 
E, RAFE, KARE o 


人 和 人生， 又 是 一 个 又 一 个 小 小 的 队列 重 现 。 春 夏秋 冬 轮回 年 年 ， 早 中 晚 
夜 循环 天 天 。 变 化 的 是 时 间 ， 不 变 的 是 你 对 未 来 执著 的 信念 。 


人 生 ， 更 需要 有 队列 精神 的 体现 。 南 极 到 北极 ， 不 过 是 南 纬 90 度 到 北 
纬 90 度 的 队列 ， 如 果 你 中 途 犹 豫 ， 临 时 转 同 ， 也 许 你 束 只 能 和 企 斤 相 
人 


谢谢 大 家 ， 下 课 。 
第 5 章 串 

启示 

ΒΒ. 

ΒΒ (string) 是 由 零 个 或 多 个 字符 组 成 的 有 限 序列 ， 又 名 叫 字符 串 。 
5.1 开场 白 

同学 们 ， 大 家 好 ! 我 们 开始 上 新 的 一 课 。 


我 们 古人 没有 电影 电视 ， 没 有 游戏 网 络 ， 所 以 文人 们 束 会 想 出 一 些 文 
字 洲 戏 来 将 乐 。 比 如 宋代 的 李 帅 写 了 这 样 一 首 诗 : “ 柯 眼 望 遥 山 隅 水 ， 
往来 曾 见 儿 心 知 ? EANNA, E PERMES ° RREA ADI 
久 ， 讯 音 无 雁 寄 回 迟 。 孤 灯 夜 守 长 容 寂 ， 夫 忆 妻 今 父 忆 儿 。? 显 然 这 是 
老公 想念 老婆 和 儿子 的 诗句 。 曾 经 和 妻 儿 在 一 起 ， 尽 享 天 伦 之 乐 ， 现 
ee ο ολ 
η 


BY FFA — Te ACE, REPAY DMBIOR IE: “LICR SICK, Bl 
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笔 ， 酒 杯 一 酌 怕 衬 壶 。 知 心 儿 见 曾 来 往 ， 水 隔山 遥望 眼 枯 。” 这 表达 了 
什么 意思 呢 ? 呵呵 ， 表 达 了 妻子 对 丈夫 的 思念 。 老 公 离 开 好 久 ， 路 途 
遥远 ， 难 以 相 见 。 写 信 不 知道 写 什 么 ， 独 目 喝 酒 也 没什么 兴致 。 只 能 
和 儿子 夜 夜 守 在 家 里 一 二 扳 灯 下 ， 否 等 老公 的 归来 。 


这 种 诗 体 叫做 回 文 诗 。 它 是 一 种 可 以 倒 读 或 反复 回旋 阅读 的 诗 体 。 刚 
才 这 首 就 是 正 读 是 丈夫 思念 妻子 ， 倒 读 是 麦子 思念 丈夫 的 古诗 。 是 不 
是 感觉 很 奇妙 呢 ? 


在 英语 单词 中 ， 同 样 有 神奇 的 地 方 。“ 即 使 是 lover 也 有 个 over， 即 使 是 
friend 也 有 个 end， 即 使 是 believe 也 有 个 lie。” 你 会 发 现 ， 本 来 不 相干 ， 
其 至 对 立 的 两 个 词 ， 却 有 某 种 神奇 的 联系 。 这 可 能 是 创造 这 几 个 单词 
的 那些 智者 们 也 没有 想到 的 问题 。 
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5.2 RAE SM 

早先 的 计算 机 在 被 发 明 时 ， 主 要 作用 是 做 一 些 科 学 和 工程 的 计算 工 
作 ， 也 就 是 现在 我 们 理解 的 计算 器 ， 只 不 过 它 比 小 小 计算 器 功能 更 强 
大 、 速 度 更 快 一 些 。 后 来 发 现 ， 在 计算 机 上 作 非 数值 处 理 的 工作 越 来 
越 多 ， 使 得 我 们 不 得 不 需要 引入 对 字符 的 处 理 。 于 是 就 有 了 字符 串 的 
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已 经 把 我 们 想 要 的 “数据 结构 ? 列 在 下 面 了 。 显 然 这 里 网 站 作 了 一 个 字 
符 串 查找 匹配 的 工作 ， 如 图 5-2-1 所 示 。 


图 5-2-1 
今天 我 们 就 是 来 研究 “ 串 * 这 样 的 数据 结构 。 先 来 看 定义 。 
FA (string) 是 由 零 个 或 多 个 字符 组 成 的 有 限 序列 ， 叉 名 叫 字符 串 。 


一 般 记 为 s="a lay .av "(n>0)， 其 中 ，s 是 串 的 名 称 ， 用 双 引 号 (有 些 
书 中 也 用 单 引号 ) 括 起 来 的 字符 序列 是 串 的 值 ， 注 意 引号 不 属于 串 的 
AR ea, Gsis) 可 以 是 字母 、 数 字 或 其 他 字符 ，i 就 是 该 字符 在 串 中 
的 位 置 。 串 中 的 字符 数目 n 称 为 串 的 长 度 ， 定 义 中 谈 到 “有 限 * 是 指 长 度 
n 是 一 个 有 限 的 数值 。 零 个 字符 的 串 称 为 空 串 (nullstring) ， 它 的 长 度 
为 零 ， 可 以 直接 用 两 双 引 号 "表示 ， 也 可 以 用 希腊 字母 “<®” 来 表示 。 
所 谓 的 序列 ， 说 明 串 的 相 邻 字符 之 间 具 有 前 驱 和 后 继 的 关系 。 


还 有 一 些 概念 需要 解释 。 

空格 串 ， 是 只 包含 空格 的 串 。 注 意 它 与 至 如 的 区 别 ， 空 格 串 是 有 内 容 
有 长 度 的 ， 而 且 可 以 不 止 一 个 空格 。 

子 串 与 主 串 ， 串 中 任意 个 数 的 连续 字符 组 成 的 子 序列 称 为 该 串 的 子 
串 ， 相 应 地 ， 包 含 子 串 的 串 称 为 主 串 。 

子 串 在 主 串 中 的 位 置 就 是 子 串 的 第 一 个 字符 在 主 串 中 的 序号 。 
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5.3 BWER 


两 个 数字 ， 很 容易 比较 大 小 。2 比 1 大 ， 这 完全 正确 ， 可 是 两 个 字符 串 
如 何 比较 ? 比如 “sily”`“stupid" 这 样 的 同样 表达 “ 愚 春 的 ?的 单词 字符 
串 ， 它 们 在 计算 机 中 的 大 小 其 实 取决 于 它们 挨个 字母 的 前 后 顺序 。 它 
们 的 第 一 个 字母 都 是 “s”， 我 们 认为 不 存在 大 小 差异 ， 而 第 二 个 字母 ， 
国有 

说 “silly”<“stupid”。 


事实 上 ， 串 的 比较 是 通过 组 成 串 的 字符 之 间 的 编码 来 进行 的 ， 而 字符 
的 编码 指 的 是 字符 在 对 应 字符 集中 的 序号 。 


计算 机 中 的 常用 字符 是 使 用 标准 的 ASCII 编 码 ， 更 准确 一 点 ， 由 7 位 二 
进 制 数 表 示 一 个 字符 ， 总 共 可 以 表示 128 个 字符 。 后 来 发 现 一 些 特殊 从 
号 的 出 现 ，128 个 不 够 用 ， 于 是 扩展 ASCII 码 由 8 位 二 进 制 数 表示 一 个 字 
符 ， 总 共 可 以 表示 256 个 字符 ， 这 已 经 足够 满足 以 英语 为 主 的 语言 和 特 
殊 符号 进行 输入 、 存 储 、 输 出 等 操作 的 字符 需要 了 “。 可 是 ， 单 我 们 国 
ARB ARDS AoA > TEL > jae > Be > AEG RES PARIS, 
换 作 全 世界 估计 要 有 成 百 上 和 于 种 语言 与 文字 ， 显 然 这 256 个 字符 是 不 够 
的 ， 因 此 后 来 怠 有 了 Unicode 编 码 ， 比 较 间 用 的 是 由 16 位 的 二 进 制 数 表 
示 一 个 字符 ， 这 样 点 共 残 可 以 表示 2 

16 个 字符 ， 约 是 6.5 万 多 个 字符 ， 足 够 表示 世界 上 所 有 语言 的 所 有 字符 
了 。 当 然 ， 为 了 和 ASCII 码 兼容 ，Unicode 的 前 256 个 字符 与 ASCII 码 完 
全 相同 ο 

所 以 如 果 我 们 要 在 C 语 言 中 比较 两 个 串 是 否 相 等 ， 必 须 是 它们 串 的 长 度 
以 及 它们 各 个 对 应 位 置 的 字符 都 相等 时 ， 才 算是 相等 。 即 给 定 两 个 
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那么 对 于 两 个 串 不 相等 时 ， 如 何 判 定 它们 的 大 小 呢 。 我 们 这 样 定 义 : 


给 定 两 个 串 : s="a1a 5....…..an"，t="b1b .bm，"， 当 满足 以 下 条 件 之 
= 中 中 δεις 


有 
例如 当 s=“hap”，t=“happy”， 束 有 s<t。 因 为 t 比 s 多 出 了 两 个 字母 。 


2. 存在 某 个 ksmin (m, n) ,使 得 a;=b; (i=1, 2, ....... k-1) ，ak 
“υπο. 


例如 当 s="happen"，t='"happy"， 因 为 两 串 的 前 4 个 字母 均 相 同 ， 而 两 串 
第 5 个 字母 (kE) ， 字 母 e 的 ASCII 码 是 101， 而 字母 y 的 ASCII 码 是 
121， 显 然 e<y， 所 以 s<t ° 


有 同学 如 果 对 这 样 的 数学 定义 很 不 爽 的 话 ， 那 我 再 说 一 个 字符 串 比 较 
的 应 用 。 
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图 5-3-1 


αν 有 同学 说 ， 从 不 查 纸 奈 词典 ， 都 是 用 电子 词典 。 电 子 词典 查找 单 
词 实现 的 原理 ， 其 实 就 是 字符 串 这 种 数据 结构 的 典型 应 用 ， 随 着 我 们 
之 后 的 讲解 ， 大 家 束 会 明日 。 


5.4 串 的 抽象 数据 类 型 


串 的 逻辑 结构 和 线性 表 很 相似 ， 不 同 之 处 在 于 串 针 对 的 是 字符 集 ， 也 
就 是 串 中 的 元 素 都 是 字符 ， 哪 怕 串 中 的 字符 是 “123” 这 样 的 数字 组 成 ， 
或 者 “2010-10-10” 这 样 的 日 期 组 成 ， 它 们 都 只 能 理解 为 长 度 为 3 和 长 度 
为 10 的 字符 串 ， 每 个 元 素 都 是 字符 而 已 。 


因此 ， 对 于 串 的 基本 操作 与 线性 表 是 有 很 大 差别 的 。 线 性 表 更 关注 的 
征 单 个 元 素 的 操作 ， 比 如 查找 一 个 元 素 ， 揪 入 或 删除 一 个 元 素 ， 但 串 
中 更 多 的 羡 碍 找 子 串 位 置 、 得 到 指定 位 置 子 串 、 蔡 换 子 串 等 操作 。 


ADT (string) 


Data 


串 中 元 素 仅 由 一 个 字符 组 成 ， 相 邻 元 素 具 有 前 驱 和 后 继 关 系 。 


=| 


Operation 
StrAssign(T, *chars): 生成 一 个 其 值 等 于 字符 串 常量 chars 的 串 T。 
StrCopy(T, S): 串 S 存 在 ， 由 串 S 复 制 得 串 T。 
ClearString(S): PSEA, HRAS ° 
StringEmpty(S): 若 串 S 为 空 ， 返 回 true， 和 否则 返回 false 5 
StrLength(S): 返回 串 S 的 元 素 个 数 ， 即 串 的 长 度 。 
StrCompare(S, T): 若 S>T， 返 回 值 >0， 若 S=T， 返 回 0， 若 S<T， 返 回 值 <0。 
Concat Ges mS T 返 回 由 S1 和 S2 联 接 而 成 的 新 串 。 


SubString(Sub, S, pos, len): 串 S 存 在 ，1<pos<StrLength(S)， 


9<len<StrLength(S)-pos+1， 用 Sub 返 


避 串 S 的 第 pos 个 字符 起 长 度 为 len 的 子 串 。 


Index(S, T, pos): 串 S 和 T 存 在 ，T 是 非 空 串 ，1<pos<StrLength(S)。 


若 主 串 S 中 存在 和 串 T 值 相同 的 子 串 ， 则 返回 它 在 主 串 S 中 


第 pos 个 字符 之 后 第 一 次 出 现 的 位 置 ， 否 则 返回 0 ο 


Replace(S, T, V): HBS TAVEE, TSE ο AVERRESS HH LATA 
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StrInsert(S, pos, T): 串 S 和 T 存 在 ，1<pos<StrLength(S)+1。 


在 捉 S 的 第 pos 个 字符 之 前 插入 串 T。 


StrDelete(S, pos, len): 串 S 存 在 ，1<pos<StrLength(S)-1Len+1。 


从 串 S 中 删除 第 pos 个 字符 起 长 度 为 en 的 子 串 。 


endADT 


对 于 不 同 的 高 级 语言 ， 其 实 对 串 的 基本 操作 会 有 不 同 的 定义 方法 ， 所 
以 同学 们 在 用 某 个 语言 操作 字符 串 时 ， 需 要 先 查 看 它 的 参考 手册 关于 
字符 串 的 基本 操作 有 哪些 。 不 过 还 好 ， 不 同 语言 除 方法 名 称 外 ， 操 作 
实质 都 是 相 类 似 的 。 比 如 C# 中 ， 字 人 符 串 操作 了 束 还 有 ToLower 转 小 写 、 
ToUpper 转 大 写 、In-dexOf 从 左 查 找 子 串 位 置 (操作 名 有 修改 ) ` 
LastIndexOf 从 右 查 找 子 串 位 置 、Trim 去 除 两 边 空格 等 比较 方便 的 操 
作 ， 它 们 其 实 束 是 前 面 这 些 基本 操作 的 扩展 玉 数 。 


我 们 来 看 一 个 操作 Index 的 实现 算法 。 


/* T 为 非 空 串 。 者 主 串 S 中 第 pos 个 字符 之 后 存在 与 T 


ASAT, */ 


/* 则 返回 第 一 个 这 样 的 子 串 在 S 中 的 位 置 ， 否 则 返 


π 3/ 


int Index(String S, String T, int pos) 
{ 

amenn n αν 

String sub; 

if (pos > 0) 

{ 


/* 得 到 主 串 S 的 长 度 */ 


n = StrLength(S); 


/* 得 到 子 串 T 的 长 度 */ 


m = StrLength(T); 


i = pos; 


while (i <= n - m + 1) 


{ 


/* Ar 


/* 长 度 与 T 相 等 子 串 给 sub */ 


Substrnmdg(CsubREs nm, 


/* 如 果 两 串 不 相等 */ 
if (StrCompare(sub, T) != 0) 


++i; 


/* 如 果 两 串 相等 */ 


else 


/* 则 返回 i 值 */ 


return i; 


} 


/* 若 无 子 串 与 7 相等， 返回 @ */ 


return 0; 


} 


当中 用 到 了 StrLength、SubString、StrCom-pare 等 基本 操作 来 实现 。 
5.5 ” 串 的 存储 结构 

串 的 存储 结构 与 线性 表 相 同 ， 分 为 两 种 。 

5.5.1 串 的 顺序 存储 结构 

串 的 顺序 存储 结构 是 用 一 组 地 址 连续 的 存储 单元 来 存储 串 中 的 字符 序 
列 的 。 按 照 预 定义 的 大 小 ， 为 每 个 定义 的 串 变 量 分 配 一 个 固定 长 度 的 
存储 区 。 一 般 是 用 定 长 数组 来 定义 。 

既然 是 定 长 数组 ， 就 存在 一 个 预定 义 的 最 大 串 长 度 ， 一 般 可 以 将 实际 
的 串 长 度 值 保 存在 数组 的 0 下 标 位 置 ， 有 的 书 中 也 会 定义 存储 在 数组 的 


最 后 一 个 下 标 位 置 。 但 也 有 些 编程 语言 不 想 这 么 干 ， 觉 得 存 个 数字 占 
个 空间 麻烦 。 它 规定 在 串 值 后 面 加 一 个 不 计 入 串 长 度 的 结束 标记 字 


符 ， 比 如 “0? 来 表示 串 值 的 终结 ， 这 个 时 候 ， 你 要 想 知 道 此 时 的 串 长 
ο πμ ο ο ο 
可 必 呢 。 


串 值 ， 其 长 度 为 


μην MaxSize 


图 5-5-1 


刚才 讲 的 串 的 顺序 存储 方式 其 实 是 有 问题 的 ， 因 为 字符 串 的 操作 ， 比 
如 两 串 的 连接 Concat、 新 串 的 插入 StrInsert， 以 及 字符 串 的 替换 
Replace， 都 有 可 能 使 得 串 序 列 的 长 度 超 过 了 数组 的 长 度 Max-Size ο 


说 说 我 当年 的 一 件 图 事 。 手 机 发 短信 时 ， 运 昔 商 规定 每 条 短信 限制 70 
个 字 。 大 约 八 年 前 ， 我 的 手机 每 当 我 写 了 超过 70 个 子 后 ， 它 谍 提 示 “ 短 
信 过 长 ， 请 删 减 后 重 发 。” 后 来 我 换 了 一 个 手机 后 再 没有 这 样 见 见 的 提 
示 了 ， 我 很 高 兴 。 一 次 ， 因 为 一 点 小 予 盾 需要 向 当时 的 女友 解释 一 
下 ， 我 准备 发 一 条 短信 ， 一 共 打 了 79 个 字 。 最 后 的 部 分 字 实际 是 “.………. 
只 会 说 好 听 的 话 ， 像 我 恨 你 ' 这 种 话 是 不 可 能 说 的 ”。 点 发 送 。 后 来 得 
ο. ον 只 有 70 个 字 ， 短 信 结 尾 是 “.…… 只 会 说 好 听 的 话 ， 像 我 
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ANS. ARHAR., ABR 
只 是 因为 我 上 班 时 被 老板 
=, CERBA, MUE 
和 你 约会 时 就 说 了 一 些 不 
该 说 的 话 ， 就 算 要 说 , 也 l 
ees. cd 
你 " 


1ος ΤΠ 返回 


图 5-5-2 


有 这 样 截断 的 吗 ? 我 后 来 知道 这 个 情况 后 ， 恨 不 得 把 手机 砸 了 。 显 
A, 无论 古 上 洲 提 示 报 馆 ， 还 十 对 多 出 来 的 字符 串 截 尾 ， 部 不 古 什 么 
好 办 法 。 但 字符 串 操 作 中 ， 这 种 情况 比比 首 是 。 


于 是 对 于 串 的 顺序 存储 ， 有 一 些 变化 ， 串 值 的 存储 空间 可 在 程序 执行 
过 程 中 动态 分 配 而 得 。 比 如 在 计算 机 中 存在 一 个 自由 存储 区 ， 叫 
做 “ 推 *”。 这 个 堆 可 由 C 语 言 的 动态 分 配 函 数 malloc() 和 free() 来 管理 。 


5.5.2” 串 的 链 式 存 储 结构 


对 于 串 的 链 式 存储 结构 ， 与 线性 表 是 相似 的 ， 但 由 于 串 结 构 的 特殊 

性 ， 结 构 中 的 每 个 元 素数 据 是 一 个 字符 ， 如 琳 也 信 单 的 应 用 链表 存储 
串 值 ， 一 个 结 点 对 应 一 个 字符 ， 就 会 存在 很 大 的 空间 浪费 。 因 此 , 一 
个 结扎 可 以 存放 一 个 字符 ， 也 可 以 考虑 存放 多 个 字符 ， 最 后 一 个 结 点 
奉 是 未 被 占 满 时 ， 可 以 用 “#* 或 其 他 非 串 值 字 符 补 全 ， 如 图 5-5-3 所 示 。 


图 5-5-3 


当然 ， 这 里 一 个 结 点 存 多 少 个 字符 才 合 过 了 驶 要 得 很 重要 ， 这 会 直接 影 
响 着 串 处 理 的 效率 ， 需 要 根据 实际 情况 做 出 选择 。 


但 串 的 链 式 存储 结构 除了 在 连 毛囊 与 串 操 作 时 有 一 定 方便 之 外 ， 忌 的 
来 说 不 如 顺序 存储 灵活 ， 性 能 也 不 如 顺序 存储 结构 好 。 


5.6 ”朴素 的 模式 匹配 算法 


记得 我 在 刚 做 软件 开发 的 时 候 ， 需 要 阅读 一 些 英 文 的 文章 或 帮助 。 此 
时 才 发 现 学 习 英 语 不 只 是 为 了 过 四 六 级 ， 工 作 中 它 还 是 挺 重要 的 。 而 
我 那 只 为 应 付 考 试 的 喘 语 ， 早 已 经 起 得 差不多 了 。 于 是 我 想 在 短 时 间 
内 突击 一 下 ， 很 明显 ， 找 一 本 词典 从 头 开 始 育 不 是 什么 好 的 办 法 。 要 
至 也 得 背 那 些 最 常用 的 ， 至 少 苹 计算 机 文献 中 常用 的 ， 于 是 我 束 想 日 
己 写 一 个 程序 ， 只 要 输入 一 些 英 文 的 文档 ， 就 可 以 计算 出 这 当中 所 用 


频率 最 高 的 词汇 是 哪些 。 把 它们 都 背 好 了 ， 基 本 上 阅读 也 束 不 成 问题 
Τ 5 


当然 ， 说 说 容易 ， 要 实现 这 一 需求 ， 当 中 会 有 很 多 困难 ， 有 兴趣 的 同 
和 学， 不妨 去 斌 试看。 不 过 ， 这 里 面 最 重要 其 实 束 是 去 找 一 个 单词 在 一 
篇 文章 (相当 于 一 个 大 字符 串 ) 中 的 定位 问题 。 这 种 子 串 的 定位 操作 
通常 称 做 串 的 模式 匹配 ， 应 该 算是 串 中 最 重要 的 操作 之 一 。 


假设 我 们 要 从 下 面 的 主 串 S="goodgoogle" 中 ， 找 到 T="google" 这 个 子 串 
的 位 置 。 我 们 通常 需要 下 面 的 步 又。 


1. 主 串 S 第 一 位 开始 ，S 与 T 前 三 个 字母 都 匹配 成 功 ， 但 S 第 四 个 字母 十 
d 而 T 的 是 g。 第 一 位 匹配 失败 。 如 图 5-6-1 所 示 ， 其 中 坚 直 连 线 表示 相 
等 ， 闪 电 状 弯 折 连 线 表示 不 等 。 


图 5-6-1 


2. 主 串 S 第 二 位 开始 ， 主 串 S$ 首 字母 是 o， 要 匹配 的 T 首 字母 是 g， 匹 配 
失败 ， 如 图 5-6-2 所 示 。 


图 5-6-2 


3. 主 串 S 第 三 位 开始 ， 主 串 S$ 首 字母 是 o， 要 匹配 的 T 首 字母 是 g， 匹 配 
失败 ， 如 图 5-6-3 所 示 。 


图 5-6-3 


4. 主 串 S$ 第 四 位 开始 ， 主 串 $ 首 字母 是 4， 要 匹配 的 T 首 字母 是 g， 匹 配 
失败 ， 如 图 5-6-4 所 示 。 


图 5-6-4 


主 串 S 第 五 位 开始 ，S 与 TI，6 个 字母 全 匹配 ， 匹 配 成 功 ， 如 图 5-6-5 
所 示 。 


图 5-6-5 


简单 的 说 ， 殊 是 对 主 串 的 每 一 个 字符 作为 子 捉 开头 ， 与 要 匹配 的 字符 
捉 进 行 匹 配 。 对 主 串 做 大 循环 ， 每 个 字符 开头 做 T 的 长 度 的 小 循环 ， 直 
到 匹配 成 功 或 全 部 遇 历 完成 为 止 。 


前 面 我 们 已 经 用 串 的 其 他 操作 实现 了 模式 匹配 的 算法 Index。 现 在 考虑 
不 用 串 的 其 他 操作 ， 而 是 只 用 基本 的 数组 来 实现 同样 的 算法 。 注 意 我 
人 


/* 返回 子 串 T 在 主 串 S 中 第 pos 个 字符 之 后 的 位 置 


若 不 存在 ， 则 函数 返回 值 为 0。 */ 


/* T 非 空 ，1<pos<StrLength(S)。 */ 
int Index(String 5, String T, int pos) 


{ 


/* 用 于 主 串 S 中 当前 位 置 下 标 ， 若 pos 不 为 1 */ 


/* 则 从 pos 位 始 匹配 */ 


int i = pos; 


/* 了 j 用 于 子 串 T 中 当前 位 置 下 标 值 */ 


int 1 Ξ 1; 


/* 若 i 小 于 S 长 度 且 j 小 于 T 的 长 度 时 循环 */ 


while (i <= 5[0] && j <= T[0]) 
{ 


/* 两 字母 相等 则 继续 », 


SEE 
{ 

++i; 

ἘΠ}; 
y 


/* 指针 后 退 重新 开始 匹配 */ 


else 


/* 并 退回 到 上 次 匹配 首位 的 下 一 位 */ 


ο ο 


all 
/* ]j 退 回 到 子 串 T 的 首位 */ 
i 


P GE S NON 
return i - Τ[8]; 
else 


return 0; 


} 


分 析 一 下 ， 最 好 的 情况 是 什么 ? 那 就 是 一 开始 就 区 配 成 功 ， 比 

如 “googlegood” 中 去 找 “google”， 时 间 复 杂 度 为 0(1)。 稍 差 一 些 ， 如 果 
ANIA GIF PB. =. OLE, RARER SEALE, ABA 
WTR TT, Ea “abcdef-google” # BFK “google” ο JPA 
时 间 复 杂 度 为 Omn+m)， 其 中 n 为 主 串 长 度 ，m 为 要 匹配 的 子 串 长 度 。 根 
据 等 概率 原则 ， 平 均 是 m+m)/2 次 查找 ， 时 间 复 杂 度 为 O(n+m)。 


那么 最 坏 的 情况 又 是 什么 ? 就 是 每 次 不 成 功 的 匹配 都 发 生 在 串 T 的 最 后 
一 个 字符 。 举 一 个 很 极端 的 例子 。 主 串 为 
S="00000000000000000000000000000000000000000000000001"， 而 要 
还 配 的 子 串 为 T="0000000001"， 前 者 是 有 49 个 “0” 和 1 个 “1” 的 主 串 ， 后 
者 是 9 个 “0” 和 1 个 “1” 的 子囊。 在 匹配 时 ， 每 次 都 得 将 TT 中 字符 循环 到 最 
后 一 位 才 发 现 : 哦 ， 原 来 它们 是 不 匹配 的 。 这 样 等 于 T 串 需要 在 S 串 的 
前 40 个 位 置 都 需要 判断 10 次 ， 并 得 出 不 匹配 的 结论 ， 如 图 5-6-6 所 示 。 
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图 5-6-6 


直到 最 后 第 41 个 位 置 ， 因 为 全 部 匹配 相等 ， 所 以 不 需要 再 继续 进行 下 
去 ， 如 图 5-6-7 所 示 。 如 果 最 终 没 有 可 匹配 的 子 串 ， 比 如 是 
T="0000000002"， 到 了 第 41 位 置 判 断 不 匹配 后 同样 不 需要 继续 比 对 下 
去 。 因 此 最 坏 情况 的 时 间 复 杂 度 为 O(n-m 十 1)*m)。 


WAFA 
T 在 第 41 个 las ΠΠ 于 区 配 成 功 。 


期 间 进行 了 【50-10+1 ) x10 次 判断 操作 


图 5-6-7 


不 要 以 为 我 这 只 是 危 言 答 昕 ， 在 实际 运用 中 ， 对 于 计算 机 来 说 ， 处 理 
的 都 是 二 进位 的 0 和 1 的 串 ， 一 个 字符 的 ASCII 码 也 可 以 看 成 是 8 位 的 二 
进位 01 串 ， 当 然 ， 汉 子 等 所 有 的 子 符 也 都 可 以 看 成 是 多 个 0 和 1 组 成 的 
串 。 再 比如 像 计算 机 图 形 也 可 以 理解 为 是 由 许 许 多 多 个 0 和 1 的 串 组 
成 。 所 以 在 计算 机 的 运算 当中 ， 模 式 匹 配 操 作 可 说 是 随处 可 见 ， 而 刚 
才 的 这 个 算法 ， 驶 显得 太 低 效 了 。 


57 KMP 模 式 匹 配 算 法 


你 们 可 以 忍受 朴素 模式 匹配 算法 的 低 效 吗 ? 也 许 不 可 以 、 也 许 无 所 

谓 。 但 在 很 多 年 前 我 们 的 科学 家 们 ， 觉 得 像 这 种 有 多 个 0 和 1 重复 字符 

的 字符 串 ， 模 式 匹 配 需要 挨个 遍历 的 算法 是 非常 糟糕 的 。 于 是 有 三 位 

BÆ, D.E. Knuth ` J.H. Morris 和 VR. Pratt (其 中 Knuth 和 Pratt 共 同人 研 

究 ，Mor-ris 独 立 研 究 ) 发 表 一 个 模式 匹配 算法 ， 可 以 大 大 避免 重复 遍 

HOTEL, 我 们 把 它 称 之 为 克 努 特 一 莫 里 斯 一 普 拉 特 算法 ， 人 简称 KMP 
ΤΑ k 

5.7.1 KMP 模 式 匹 配 算法 原理 

为 了 能 讲 清楚 KMP 算 法 ， 我 们 不 直接 讲 代 码 ， 那 样 很 容易 造成 理解 困 

难 ， 还 是 从 这 个 算法 的 研究 角度 来 理解 为 什么 它 比 朴素 算法 要 好 ο 

如 果 主 串 S="abcdefgab"， 其 实 还 可 以 更 长 一 些 ， 我 们 束 省 略 掉 只 保留 

前 9 位 ， 我 们 要 匹配 的 T="abcdex"， 那 么 如 果 用 前 面 的 朴素 算法 的 话 ， 


前 5 个 字母 ， 两 个 串 完 全 相等 ， 直 到 第 6 个 字母 ，“ 台 与 “zx 不 等 ， 如 图 5- 
7-1 的 CD 所 示 。 


图 5-7-1 


接 下 来 ， 按 照 朴素 模式 匹配 算法 ， 应 该 是 如 图 5-7-1 的 流程 CGO 9 
即 主 串 S 中 当 i=2、3、4、5、6 时 ， 首 字符 与 子 串 T 的 首 字符 均 不 等 。 


似乎 这 也 是 理所当然 ， 原 来 的 算法 就 是 这 样 设计 的 。 可 仔细 观察 发 
现 。 对 于 要 匹配 的 子 串 T 来 说 , “abcdex” 首 字母 “a" 与 后 面 的 

串 "bcdex" 中 任意 一 个 字符 都 不 相等 。 也 就 是 说 ， 既 然 “a" 不 与 目 己 后 面 
的 子 串 中 任何 一 字符 相等 ， 那 么 对 于 图 5-7-1 的 (来 说 ， 前 五 位 字符 分 
别 相等 ， 意 味 着 子 串 T 的 首 字符 “a" 不 可 能 与 S 串 的 第 2 位 到 第 5 位 的 字符 
AAS o FEAS-7-1F, QOOOHFIMABEL R ° 


注意 这 里 是 理解 KMP 算 法 的 关键 。 如 果 我 们 知道 T 串 中 首 字 符 “a" 与 T 中 
后 面 的 字符 均 不 相等 (注意 这 是 前 提 ， 如 何 判断 后 面 再 讲 ) 。 而 T 串 的 


第 二 位 的 “b” 与 s 串 中 第 二 位 的 “b” 在 图 5-7-1 的 了 中 已 经 判断 是 相等 的 ， 

那么 也 就 意味 着 ，T 串 中 首 字符 “a” 与 $ 串 中 的 第 二 位 “b” 是 不 需要 判断 

也 知道 它们 是 不 可 能 相等 了 ， 这 样 图 5-7-1 的 @ 这 一 步 判 断 是 可 以 省 略 
的 ， 如 图 5-7-2 所 示 。 


ina? ae 
ΠΗ PE] fbk 


δ ο 

TNFa TFS BETIE RESTATE NEN 

ΕΜΠ ΤΗ, THD EATER 
图 5-7-2 


同样 道理 ， 在 我 们 知道 T 串 中 首 字符 “a"* 与 T 中 后 面 的 字符 均 不 相等 的 前 
提 下 ，T 串 的 “a* 与 S 串 后 面 的 *c”、“d”\“e" 也 都 可 以 在 Q 之 后 就 可 以 确 
定 是 不 相等 的 ， 所 以 这 个 算法 当中 人 CGI 没有 必要 ， 只 保留 do) 即 
可 ， 如 图 5-7-3 所 示 。 


图 5-7-3 


之 所 以 保留 (69) 中 的 判断 是 因为 在 已 中 T[6] 上 S[6]， 尽 管 我 们 已 经 知道 
T[1]xT[6]， 但 也 不 能 断定 T[1] 一 定 不 等 于 S[6]， 因 此 需要 保留 @) 这 一 


IE ο 
有 人 就 会 问 ， 如 果 T 串 后 面 也 含有 首 字符 “a” 的 字符 怎么 办 呢 ? 


我 们 来 看 下 面 一 个 例子 ， 假 设 $S="abcababca"，T="abcabx"。 对 于 开始 
的 判断 ， 前 5 个 字符 完全 相等 ， 第 6 个 字符 不 等 ， 如 图 5-7-4 的 4)。 此 

上 时， 根据 刚才 的 经 验 ，T 的 首 字 符 “a” 与 T 的 第 二 位 字符 “b”、 第 二 位 字 
符 “c"” 均 不 等 ， 所 以 不 需要 做 判断 ， 图 5-7-4 的 朴素 算法 步骤 GCC) 都 是 多 


A 
Ὁ 


图 5-7-4 


因为 T 的 首位 “a” 与 T 第 四 位 的 “a”* 相 等 ， 第 二 位 的 “b” 与 第 五 位 的 “b” 相 
等 。 而 在 几时， 第 四 位 的 “a" 与 第 五 位 的 “b” 已 经 与 主 串 $ 中 的 相应 位 置 
比较 过 了 ， 是 相等 的 ， 因 此 可 以 断定 ，T 的 下 字符 “a”、 第 二 位 的 字 

符 “b” 与 的 第 四 位 字符 和 第 五 位 子 符 也 不 需要 比较 了 ， 肯 定 也 是 相等 
的 一 一 之 前 比较 过 了 ， 还 判断 什么 ， 所 以 Go 这 两 个 比较 得 出 字符 相等 
的 步 又 也 可 以 省 略 。 

也 就 是 说 ， 对 于 在 子 串 中 有 与 首 字 符 相 等 的 字符 ， 也 是 可 以 省 略 一 部 


分 不 必要 的 判断 步 又 。 如 图 5-7-5 所 示 ， 省 略 掉 右 图 的 T 串 前 两 
位 “a” 与 “b”* 同 S 串 中 的 4、5 位 置 字符 匹配 操作 。 


图 5-7-5 


对 比 这 两 个 例子 ， 我 们 会 发 现在 时 ， 我 们 的 i 值 ， 也 就 是 主 串 当前 位 
置 的 下 标 是 6，@XY42YS)，i 值 是 2、3、4、5， 到 了 (@，i 值 才 又 回 到 了 
6。 即 我 们 在 朴素 的 模式 匹配 算法 中 ， 主 串 的 i 值 是 不 断 地 回 济 来 完成 
的 。 而 我 们 的 分 析 发 现 ， 这 种 回溯 其 实 是 可 以 不 需要 的 一 一 下 所谓 好 
Dee 我 们 的 KMP 模 式 匹 配 算 法 就 是 为 了 让 这 没 必要 的 回 济 


既然 i 值 不 回 沛 ， 也 或 古 不 可 以 变 小 ， 那 么 要 考虑 的 变化 就 是 j 值 了 。 通 

过 观察 也 可 发 现 ， 我 们 屡屡 提 到 了 T 串 的 首 字 符 与 自身 后 面 字 符 的 比 

较 ， 发 现 如 果 有 相等 字符 ，j 值 的 变化 就 会 不 相同 。 也 就 是 说 ， 这 个 j 值 

ΓΙ 天 键 束 取决 于 T 串 的 结构 中 是 否 有 重复 
ΜΠ 题 o 


比如 图 5-7-3 中 ， 由 于 T="abcdex"， 当 中 没有 任何 重复 的 字符 ， 所 以 j 就 
由 6 变 成 了 1 。 而 图 5-7-5 中 ， 由 于 T='"abcabx"， 前 组 的 “ab” 与 最 后 “x” 之 
前 串 的 后 缀 “ab” 是 相等 的 。 因 此 j 就 由 6 变 成 了 3。 因 此 ， 我 们 可 以 得 出 
规律 ，j 值 的 多 少 取决 于 当前 字符 之 前 的 串 的 前 后 缀 的 相似 度 。 
我 们 把 T 捉 各 个 位 置 的 j 值 的 变化 定义 为 一 个 数组 next， 那 么 next 的 长 度 
就 是 IT 串 的 长 度 。 于 是 我 们 可 以 得 到 下 面 的 函数 定义 ; 
0,5 j= Ih 
nextlj]= ΙΙ ΕΕ aA ppl PARR 
|, 其 他 情况 
5.7.2 ”next 数 组 值 推 导 
具体 如 何 推导 出 一 个 串 的 next 数 组 值 呢 ， 我 们 来 看 一 些 例子 。 
1. T="abcdex" 〈 如 表 5-7-1 所 示 ) 
表 5-7-1 


[ 123456 
模式 串 T abcdex 
next[j] 011111 


1) “4j=1FY, next[1]=0; 
2) 3Ι-2ΗΝ, je 1zij-1t RAS”, 58 ΓΒΗ{{18ὑππεχι[2]-1; 


3) 当 j=3 时 ，j 由 1 到 j-1 串 是 “ab”， 显 然 “a” 与 “b” 不 相等 ， 属 其 他 情况 ， 
next[3]=1; 


4) Dale, MARETE Mnext[j]011111 5 
2. T="abcabx" 〈 如 表 5-7-2 所 示 ) 


表 5-7-2 


j 123456 
RIET abcabx 
next[j] 011123 


1) 当 j=1 时 ，next[1]=0; 

2) 当 j=2 时 ， 同 上 例 说 明 ，next[2]=1; 
3) 当 j=3 时 ， 同 上 ，next[3]=1; 

4) 当 j=4 时 ， 同 上 ，next[4]=1; 


5) 34ΙΞΡΗΥ, 此 时 j 由 1 到 j-1 的 串 是 “abca”， HBAS a” a 
符 “a” 相 等 (前缀 用 下 划 线 表示 ， 后 级 用 斜体 表示 ) ， 因 此 可 推算 出 k 值 
为 2 (Η 1. ρκι Ds 得 到 pi =p, ) 因此 next[5]=2; 


6) 当 j=6 时 ，j 由 1 到 j-1 的 串 是 “abcab”， 由 于 前 缀 字符 “ab” 与 后 级 “ab” 相 
等 ， 所 以 next[6]=3。 


我 们 可 以 根据 经 验 得 到 如 果 前 后 级 一 个 字符 相等 ，k 值 是 2-， 两 个 字符 k 
值 是 3，n 个 相等 k 值 就 是 n+1。 


3. T="ababaaaba" (如 表 5-7-3 所 示 ) 


表 5-7-3 


j 123456789 
RIET ababaaaba 
next[j] 011234223 


1) 当 j=1 时 ，next[1]=0; 
2) 31ΙΞΖΗΗ, [5] Γπαχι[2]51: 
3) 91415384, [5] Επεχι[ᾶ]-1; 


4) 当 j=4 时 ，j 由 1 到 j-1 的 串 是 “aba”， 前 级 字符 “a” 与 后 缀 字符“a” 相 等 ， 
next[4]=2; 


5) 当 j=5 时 ，j 由 1 到 j-1 的 串 是 “abab”， 由 于 前 缀 字符 “ab” 与 后 缀 “ab” 相 
等 ， 所 以 next[5]=3; 


6) 当 j=6 时 ，j 由 1 到 j-1 的 串 是 “ababa”"， 由 于 前 缀 字符 “aba” 与 后 
级 “aba” 相 等 ， 所 以 next[6]=4; 


7) 当 j=7 时 ，j 由 1 到 j-1 的 串 是 “ababaa*”， 由 于 前 缀 字符 “ab” 与 后 
级 “aa” 并 不 相等 ， 只 有 “a” 相 等 ， 所 以 next[7]=2; 


8) 当 j=8 时 ，j 由 1 到 j-1 的 串 是 “ababaaa”"， 只 有 “a” 相 等 ， 所 以 
next[8]=2; 


9) 当 j=9 时 ，j 由 1 到 j-1 的 串 是 “ababaaab”， 由 于 前 缀 字符 “ab” 与 后 
组 “ab” 相 等 ， 所 以 next[9]=3。 


4. T="aaaaaaaab" (如 表 5-7-4 所 示 ) 


表 5-7-4 


j 123456789 
INET aaaaaaaab 
next[j] 012345678 


1) 当 j=1 时 ，next[1]=0; 
2) 当 j=2 时 ， 同 上 next[2]=1; 


3) 当 j=3 时 ，j 由 1 到 j-1 的 串 是 “aa”， 前 缀 字符 “a” 与 后 缀 字 名 
next[3]=2; 


J 
ο) 
> 
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4) 当 j=4 时 ，j 由 1 到 j-1 的 串 是 “aaa”， 由 于 前 级 字符 “aa” 与 后 级 “aa” 相 
等 ， 所 以 next[4]=3; 


6) 当 j=9 时 ，j 由 1 到 j-1 的 串 是 “aaaaaaaa”， 由 于 前 级 字符 “aaaaaaa” 与 后 
级 “aaaaaaa” 相 等 ， 所 以 next[9]=8。 


5.7.3 ”KMP 模 式 匹配 算法 实现 
说 了 这 么 多 ， 我 们 可 以 来 看 看 代码 了 。 


/* 通过 计算 返 下 


et 


串 T 的 next 数 组 。 */ 


void get_next(String T, int *next) 


a 
πηρα η 
i = 1; 
158 


next[1] = 0; 


/* 此 处 T[0] 表 示 串 T 的 长 度 */ 


while (i < T[0]) 
{ 


/* T[i] 表 示 后 级 的 单个 字符 ， */ 


/* T[j] 表 示 前 级 的 单个 字符 », 
i 
{ 

++i; 

ος 

next[i] = jE 
} 


else 


/* 车 字符 不 相同 ， 则 j 值 回溯 */ 


1 = ΠΕεΧΙ[11; 


这 段 代码 的 目的 束 是 为 了 计算 出 当前 要 匹配 的 串 T 的 next 数 组 。 


/* 返回 子 串 T 在 主 串 S$ 中 第 pos 个 字符 之 后 的 位 置 。 


若 不 存在 ， 则 函数 返回 值 为 0。 */ 
/* T 非 空 ，1<pos<StrLength(S)。 */ 
int Index_KMP(String 5, String T, int pos) 


{ 


/* iA ΤΞΕΒΙΘΞΙΗ ΥΕ PIMA, Ἄπρος/Ά 1, */ 


/* 则 从 pos 位 置 开 始 匹配 */ 


int i = pos; 


/* 了 用 于 子 串 T 中 当前 位 置 下 标 值 */ 


iit) eee 
/* χεν- παεχτᾶκῃ */ 


int next[255]; 


/* 对 串 T 作 分 析 ， 得 到 next 数 组 */ 


get_next(T, next); 


/* 阁 i 小 于 S 的 长 度 且 j 小 于 T 的 长 度 时 ， “7 


/* 循环 继续 », 


while (i <= S[0] && j <= T[0]) 


{ 
/* 两 字母 相等 则 继续 ， 相 对 于 朴素 算法 增加 了 */ 
/* ]j=9 判 断 */ 
EC SS ESEE EES |) 
++i; 
EEI 
} 
/* 指针 后 退 重 新 开始 匹配 */ 
else 
{ 
/* j 退 回合 适 的 位 置 ，i 值 不 变 */ 
ne 
} 
} 


if (j > T[®]) 
(ethereal ae πιο 
else 


return 0; 


加 粗 的 为 相对 于 朴 聂 匹配 算法 增加 的 代码 ， 改 动 不 算 大 ， 天 键 承 是 去 
掉 了 i 值 回调 的 部 分 。 对 于 get_next 函 数 来 说 ， 帮 IT 的 长 度 为 n， 因 只 涉 
及 到 简单 的 单 循环 ， 其 时 间 复 杂 度 为 O(m)， 而 由 于 i 值 的 不 回 滴 ， 使 得 
index_KMP 算 法 效率 得 到 了 提高 ，while 循 环 的 时 间 复 洒 度 为 O(n)。 


此 ， 整 个 算法 的 时 间 复 杂 度 为 On 十 m。 相 较 于 朴素 模式 匹配 算法 的 
O((n-m+1)*m) 来 说 ， 是 要 好 一 些 。 


这 里 也 需要 强调 ，KMP 算 法 仅 当 模式 与 主 串 之 间 存 在 许多 “部 分 匹 
配 ” 的 情况 下 才 体 现 出 它 的 优势 ， 否 则 两 者 老 异 并 不 明显 。 


5.7.4 KMP 模 式 匹 配 算法 改进 


后 来 有 人 发 现 ，KMP 还 是 有 缺陷 上 的。 比如， 如 果 我 们 的 主 串 
S="aaaabcde"， 子 串 T='"aaaaax"， 其 next 数 组 值 分 别 为 012345， 在 开始 
时 ， 当 i=5、j=5 时 ， 我 们 发 现 “b” 与 “a”* 不 相等 ， 如 图 5-7-6 的 4()， 因 此 
j=next[5]=4， 如 图 中 的 ， 此 时 “b” 与 第 4 位 置 的 “a” 依 然 不 等 ， 
j=next[4]=3， 如 图 中 的 (3)， 后 依次 是 4X5)， 直 到 j=next[1]=0 时 ， 根 据 算 
法 ， 此 时 i++、j++， 得 到 i=6、j=1， 如 图 中 的 @)。 


图 5-7-6 

我 们 发 现 ， 当 中 的 CI 步 又 ， 其 实 是 多 余 的 判断 。 由 于 T 串 的 第 
二 、 三 、 四 、 五 位 置 的 字符 都 与 首位 的 “a” 相 等， 那么 可 以 用 首位 
next[1] 的 值 去 取代 与 它 相等 的 字符 后 续 next[j] 的 值 ， 这 是 个 很 好 的 办 
法 。 因 此 我 们 对 求 next 画 数 进行 了 改良 。 


假设 取代 的 数组 为 nextval， 增 加 了 加 粗 部 分 ， 代 码 如 下 : 


/* 求 模式 串 T 的 next 函 数 修 正 值 并 存 入 数组 


nextval */ 


void get_nextval(String T, int *nextval) 


nextval[1] = 0; 


/* 此 处 T[0] 表 示 串 T 的 长 度 */ 


while (i < T[0]) 


si 


/* T[i] 表 示 后 缀 的 单个 字符 ， */ 


/* T[j] 表 示 前 级 的 单个 字符 */ 
if (j == © || T[i] == T[j]) 
{ 

ἜΝΙ 


ης 


/* 若 当前 字符 与 前 缀 字符 不 同 */ 
if (T[i] != T[j]) 


/* 则 当前 的 j 为 nextval 在 i 位 置 的 值 */ 


nextval[i] = j; 
else 


/* 如 果 与 前 绥 字 符 相 同 ， 则 将 前 缀 */ 


/* 字符 的 nextval 值 赋值 给 nextval 在 i 位 置 的 值 */ 


nextval[i] = nextval[j]; 


} 


else 


/* 若 字 符 不 相同 ， 则 j 值 回溯 */ 


1 = nextval[j]; 


实际 匹配 算法 ， 只 需要 将 “get_next(Tnext);” 改 为 “get_nextval(T,next);” 即 
可 ， 这 里 不 再 重复 。 


5.7.5 ”nextval 数 组 值 推 导 
改 民 后 ， 我 们 之 前 的 例子 nextval 值 就 与 next 值 不 完全 相同 了 。 比 如 : 
1. T="ababaaaba”( 如 表 5-7-5 所 示 ) 


表 5-7-5 


j 123456789 
模式 串 T_ ababaaaba 

next[j] 011234223 
nextval[j] 010104210 


先 算出 next 数 组 的 值 分 别 为 011234223， 然 后 再 分 别 判断 。 
1) 4j=1}, nextval[1]=0; 


2) 当 j=2 时 ， 因 第 二 位 字符 “b” 的 next 值 是 1， 而 第 一 位 就 是 “a”*， 它 们 不 
相等 ， 所 以 nextval[2]=next[2]=1， 维 持原 值 。 


3) 当 j=3 时 ， 因 为 第 三 位 字符 “a” 的 next 值 为 1， 所 以 与 第 一 位 的 “a” 比 较 
得 知 它 们 相等 ， 所 以 nextval[3]=nextval[1]=0; 如 图 5-7-7 所 示 。 


hovel, ΜΙΚΒΈΤΗ] 
与 本 位 置 的 TD] 是 否 相 条 


内 为 T[1]=T[3]， 所 以 
nextval[3|=nextval[1]=0 
图 5-7-7 


4) 当 j=4 时 ， 第 四 位 的 字符 “b”next 值 为 2， 所 以 与 第 二 位 的 “b” 相 比较 得 
到 结果 是 相等 ， 因 此 nextval[4]=nextval[2]=1; 如 图 5-7-8 所 示 。 


图 5-7-8 


5) 当 j=5 时 ，next 值 为 3， 


nextval[5]=nextval[3]=0; 


j 123 4 
ja |b) a/b) 
此 数 是 2， 因 此 查看 T[2 


与 本 位 置 的 了 [4 是 从 相等 


KATITIA, MA 


nextval[4|=nextval{2|=1 


第 五 个 字符 “a” 与 第 三 个 字符 “a” 相 等 ， 因 此 


6) 当 j=6 时 ，next 值 为 4， 


nextval[6|=4; 


7) 当 j=7 时 ，next 值 为 2， 


nextval|[7|=2; 


8) 当 j=8 时 ，next 值 为 2， 


nextval[8]|=nextval[2]=1; 


第 六 个 字符 “a” 与 第 四 个 字符 “b”* 不 相等 ， 因 此 


第 七 个 字符 “a” 与 第 二 个 字符 “b* 不 相等 ， 因 此 


第 八 个 字符 “b” 与 第 二 个 字符 “b” 相 等 ， 因 此 


9) 当 j=9 时 ，next 值 为 3， 


nextval[9]|=nextval[3]=0 ° 


第 九 个 字符 “a” 与 第 三 个 字符 “a” 相 等 ， 因 此 


2. T="aaaaaaaab" (如 表 5-7-6) 


表 5-7-6 


j 123456789 
模式 串 T_ aaaaaaaab 

next[j] 012345678 
nextval[j] 000000008 


先 算出 next 数 组 的 值 分 别 为 012345678， 然 后 再 分 别 判 断 。 
1) 44j=1}, nextval[1]=0; 


2) 当 j=2 时 ，next 值 为 1， 第 二 个 字符 与 第 一 个 字符 相等 ， 所 以 
nextval[2]=nextval[1]=0; 


3) 同样 的 道理 ， 其 后 都 为 0..……: 


4) 当 j=9 时 ，next 值 为 8， 第 九 个 字符 “b” 与 第 八 个 字符 “a” 不 相等 ， 所 以 
nextval[9|=8 5 


忌 结 改进 过 的 KMP 算 法 ， 它 是 在 计算 出 next 值 的 同时 ， 如 果 a 位 字符 与 
它 next 值 指向 的 b 位 字符 相等 ， 则 该 a 位 的 nextval 束 指 癌 b 位 的 nextval 
值 ， 如 果 不 等 ， 则 该 a 位 的 nextval 值 就 是 它 自 己 a 位 的 next 的 值 。 


5.8 “总结 回顾 


这 一 章节 我 们 重点 讲 了 “ 串 ” 这 样 的 数据 结构 ， 串 (string) 是 由 零 个 或 
多 个 字符 组 成 的 有 限 序列 ， 双 名 叫 字符 串 。 本 质 上 ， 它 是 一 种 线性 表 
的 扩展 ， 但 相对 于 线性 表 关 注 一 个 个 元 素来 说 ， 我 们 对 串 这 种 结构 更 
多 的 是 关注 它 子 串 的 应 用 问题 ， 如 查找 、 替 换 等 操作 。 现 在 的 高 级 语 
言 都 有 针对 哩 的 函数 可 以 调用 。 我 们 在 使 用 这 些 函 数 的 时 候 ， 同 时 也 
应 该 要 理解 它 当 中 的 原理 ， 以 便于 在 碰 到 复杂 的 问题 时 ， 可 以 更 加 灵 
活 的 使 用 ， 比 如 KMP 模 式 亚 配 算法 的 学 习 ， 融 是 更 有 效 地 去 理解 index 


函数 当中 的 实现 细 世 。 多 用 心 一 点 ， 说 不 定 有 一 天 ， 可 以 有 以 你 的 名 
字 命 名 的 算法 流传 于 后 世 。 
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在 我 们 这 一 章 的 开头 ， 我 已 经 提 到 了 回 文 诗 ， 其 实 那 一 首 只 能 算是 写 


得 还 不 错 而 已 。 回 文 诗 在 我 们 中 国 古 代 有 不 少 ， 不 过 当中 有 一 组 ， 严 
Ce ee eee Hai HEIL 


相传 《 璇 现 图 》 是 前 秦 才 女 苏 若 兰 因 其 丈夫 遭 人 人 迫害， 发 配 别 处 服 昔 
役 ,， 过 了 七 八 年 依然 什么 消息 都 没有 ， 苏 若 兰 很 想念 老公 ， 但 有 什么 
办 法 呢 ， 便 将 无 限 的 情思 写成 一 首 首 诗 文 ， 并 按 一 定 的 规律 排列 起 
来 ， 然 后 用 五 彩 丝 线 绣 在 锦 帕 之 上 。《 璇 现 图 》， 总 计 八 百 四 十 一 
字 ， 除 正中 央 之 “ 心 * 字 为 后 人 所 加 外 ， 原 诗 共 八 百 四 十 字 ， 纵 横 各 二 
十 九 字 ， 纵 、 横 、 斜 、 交 互 、 正 、 反 读 或 退 一 字 、 和 迭 一 字 读 均 可 成 
诗 ， 诗 有 三 、 四 、 五 、 六 、 七 言 不 等 ， 目 前 统计 可 组 成 七 千 九 百 五 十 
八 首 诗 。 看 清楚 哦 ， 是 7958 首 。 


例如 从 最 右 侧 直行 开始 ， 随 文 劳 折返 ， 可 发 现 右 上 角 区 块 外 围 顺 时 针 
RAM AMER, USABS tt, KART, DDR 
PETA”, TOR ape LENEA BSE HB AUD, Tree 
WERK, ἘΞ ΕΠΣΕ, BRERA” E GHIA) PRY 
诗句 不 胜 枚 举 ， 可 以 称 得 上 是 回 文 诗 中 的 千古 力作 了 ! 


PREM EA RAH OME WM CID A OR AA Ot ; 


ΠΕΜ ΤΟΝΟ ΤΗ WL Gan 
ΜΗΝΑ a TENA ARN RA 
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ΠΧ 188141 A T EEE 
ASETA RE TR ENE E KEEL, yit 8“ 
AIR FED ΡΕ UUE Z 141) 
Τι ΤΕ} A T fl 
PEARLE N) VEETA EEREN fE 
HAARAAN ΜΜ ΝΤ 
Hi AZ ine {8 mia ῇ HLA ἈΠ 
μμ ALLEN ΤΗ 
ΜΕΛΗ ΛΑ {| 4 ἡὶ OM EAS 
HAWES ARAN ΤΕ TASH OH RS 
GREEN BDL ΤΕΛΗ 
Pha WA A Read be td 
ΙΓ ΠΤΙ) ΠΗΡΕ ΚΡΑΝΗ 
FERAL HEREN EAI VRET 
WHAT RR μή KERER κ | 
SHREK BY Ho ηηλ 
ΠΛΗ { ΤΆ μή iy Mt By ἡ μα. 1! hf 
ΝΑΣ ΡΕΝΤΗ ΠΕΝ ΡΕΜΠ EEA 
ΕΠΗ “ἑ͵ ΚΜ 
CEASE ΕΕ ΤΗΕ κ 
OMA ΠΡ ΗΤΤΕΣ 
ΠΛΗ ΣΜΗΝΗ SO 111} 8188} 
ΑΛΜΑ ΛΗΛ ΙΟ LARA ἐν A 
ΠΙΑΝΕΙ ee A Ce 
ROTA AR AS CD KE EN EPL RAT 


图 5-9-1 
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处 ， 不 过 似乎 这 更 像 是 对 文科 学 生 的 要 求 。 我 想 强调 的 是 ， 所 谓 回 
文 ， 台 是 一 个 字 串 的 逆转 显示 ， 我 们 只 要 在 串 的 抽象 数据 类 型 中 增加 
一 种 逆转 reverse 的 操作 ， 就 可 以 实现 这 样 的 功能 。 如 果 你 可 以 利用 你 
已 有 的 数据 结构 和 算法 知识 ， 符 别 是 串 的 知识 ， 实 现 对 斑 现 图 古诗 的 
破解 〈 将 各 种 规则 下 对 应 的 诗 输出 出 来 ) ， 那 我 相信 ， 你 的 编程 能 
力 ， 至 少 在 字符 串 处 理 的 编程 能 力 已 经 到 了 一 个 非常 高 的 高 度 了 。 


好 了 ,今天 的 课 就 到 这 ， 下 课 。 

第 6 章 树 

启示 

树 : 

BY (Tree) 是 n (n20) 个 结 点 的 有 限 集 。n=0 时 称 为 空 树 。 在 任意 一 棵 


非 空 树 中 ， (1) 有 且 仅 有 一 个 特定 的 称 为 根 (Root) 的 结 点 ， (2) 
当 n> 1 时 ， 其 余 结 点 可 分 为 m (m>0) 个 互 不 相交 的 有 限 集 T，、T， 


“Th ， 其 中 每 一 个 集合 本 吴 又 是 一 柠 树 ， 并 且 称 为 根 的 子 树 
(SubTree) 。 
61 开场 白 


2010 年 一 部 电影 创造 了 奇迹 ， 它 
票房 历史 排名 第 一 的 影片 ， 那 残 
达 》 (Avatar) ο 


全 球 第 一 部 票房 到 达 27 亿 美元 、 总 
詹姆斯 - 卡 梅 隆 执导 的 电影 《 阿 凡 


aim Al 


LE 16 DÉCEMBRE: 


WW AVATARLESTL MA COM 


图 6-1-1 


电影 里 提 到 了 一 棵 高 达 900 英 斥 〈 约 274 米 ) 的 参天 巨 树 ， 是 那个 潘 多 
拉 星 球 的 纳 威 人 的 家 园 ， 让 人 印象 非常 深刻 。 可 惜 那 只 是 导演 的 梦 
想 ， 地 球 上 不 存在 这 样 的 物种 。 


无 论 多 高 多 大 的 树 ， 那 也 是 从 小 到 大 、 由 根 到 时 、 一 点 点 成 长 起 来 
的 。 丛 话说 十 年 树木 、 百 年 树 人 ， 可 一 棵 大 树 又 何止 是 十 年 这 样 容 易 
哈哈 ， 说 到 哪里 去 了 ， 我 们 现在 不 是 在 上 生物 课 ， 而 是 要 讲 一 种 
新 的 数据 结构 一 一 树 。 


62 PYRE 
之 前 我 们 一 直 在 谈 的 是 一 对 一 的 线性 结构 ， 可 现实 中 ， 还 有 很 多 一 对 


多 的 情况 需要 处 理 ， 所 以 我 们 需要 研究 这 种 一 对 多 的 数据 结构 
“ 树 ”， 考虑 它 的 各 种 特性 ， 来 解决 我 们 在 编程 中 碰 到 的 相关 问 


题 。 


树 (Tree) zen (n20) 个 结 点 的 有 限 集 。n=0 时 称 为 空 树 。 在 任意 一 棵 
非 空 树 中 : (1) 有 且 仅 有 一 个 特定 的 称 为 根 (Root) 的 结 点 ; (2) 

当 n> 41 时， 其余 结 点 可 分 为 m (m>0) 个 互 不 相交 的 有 限 集 T| `T 

a \`“ 工 ，， 其 中 每 一 个 集合 本 身 又 是 一 棵 树 ， 并 且 称 为 根 的 子 树 

(SubTree) ， 如 图 6-2-1 所 示 。 


图 6-2-1 

树 的 定义 其 实 束 是 我 们 在 讲解 栈 时 提 到 的 递归 的 方法 。 也 就 是 在 树 的 
定义 之 中 还 用 到 了 树 的 概念 ， 这 是 一 种 比较 新 的 定义 方法 。 图 6-2-2 的 
THT 和 子 树 T, 就是 根 结 点 A 的 子 树 。 当 然 ， D、G、H、I 组 成 的 树 
又 是 B 为 根 结 点 的 子 树 ，E、J 组 成 的 树 是 以 C 为 根 结 点 的 子 树 。 


图 6-2-2 


对 于 树 的 定义 还 需要 强调 两 点 ; 1.n>0 时 根 结 点 是 唯一 的 ， 不 可 能 存在 
多 个 根 结 总 ， 别 和 现实 中 的 大 树 混 在 一 起 ， 现 实 中 的 树 有 很 多 根 须 ， 
那 古 真实 的 树 ， 数 据 结构 中 的 树 是 只 能 有 一 个 根 结 态 。2.m>0 时 ， 了 于 树 
的 个 数 没 有 限制 ， 但 它们 一 定 是 互 不 相交 的 。 像 图 6-2-3 中 的 两 个 结构 
下 不 符合 树 的 定义 ， 因 为 它们 都 有 相交 的 子 树 。 


图 6-2-3 
6.2.1 ” 结 点 分 类 


树 的 结 点 包含 一 个 数据 元 奈 及 夯 干 指 回 其 子 树 的 分 文 。 结 把 拥 有 的 于 
树 数 称 为 结 点 的 度 (De-gree) 。 度 为 0 的 结 点 称 为 叶 结 点 (Leaf) 或 终 
端 结 点 ; 度 不 为 0 的 结 点 称 为 非 终端 结 点 或 分 文 结 点 。 除 根 结 点 之 外 ， 
分 文 结 点 也 称 为 内 部 结 点 。 树 的 度 是 树 内 各 结 点 的 度 的 最 大 值 。 如 图 6- 
2-4 所 示 ， 因 为 这 棵 树 结 点 的 度 的 最 大 值 是 结 点 D 的 度 ， 为 3， 所 以 树 的 


度 也 为 3。 
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图 6-2-4 


6.2.2” 结 点 间 关 系 


结 点 的 子 树 的 根 称 为 该 结 点 的 孩子 (Child) ， 相 应 地 ， 该 结 点 称 为 孩 
子 的 双亲 (Parent) 。 嗯 ， 为 什么 不 是 父 或 母 ， 叫 双亲 呢 ? 了 呵呵， 对 于 
结 点 来 说 其 父母 同体 ， 唯 一 的 一 个 ， 所 以 只 能 把 它 称 为 双亲 了 。 同一 
个 双亲 的 孩子 之 间 互 称 兄弟 (Sibling) 。 结 点 的 祖先 是 从 根 到 该 结 点 
所 经 分 文 上 的 所 有 结 点 。 所 以 对 于 H 来 说，D、B、A 都 是 它 的 祖先 。 反 
之 ， 以 某 结 点 为 根 的 子 树 中 的 任 一 结 点 都 称 为 该 结 点 的 子孙 。B 的 子孙 
有 D、G、H、I， 如 图 6-2-5 所 示 。 


--- 
- - 
Ρα 


rl, 我 们 是 兄弟 


Αλ” 
ολες ΤΡ 


D, 我 是 你 双亲 


图 6-2-5 
6.2.3” 树 的 其 他 相关 概念 
结 点 的 层次 (Level) 从 根 开 始 定义 起 ， 根 为 第 一 层 ， 根 的 孩子 为 第 二 


层 。 大 某 结 点 在 第 ] 层 ， 则 其 子 树 职 在 第 I+1 层 。 其 双亲 在 同一 层 的 结 点 
互 为 党 兄弟 。 显 然 图 6-2-6 中 的 D、E、F 是 党 兄弟 ， 而 G、H、1I 与 ] 世 是 


堂 兄弟 。 树 中 结 点 的 最 大 层次 称 为 树 的 深度 (Depth) 或 高 度 ， 当 前 树 
的 深度 为 4。 


第 一 层 


图 6-2-6 


如 果 将 树 中 结 点 的 各 子 树 看 成 从 左 至 右 是 有 次 序 的 ， 不 能 互 换 的 ， 则 
称 该 树 为 有 序 树 ， 否 则 称 为 无 序 树 。 

森林 (Forest) 是 m (m>0) 棵 互 不 相交 的 树 的 集合 。 对 树 中 每 个 结 点 
而 言 ， 其 子 树 的 集合 即 为 森林 。 对 于 图 6-2-1 中 的 树 而 言 ， 图 6-2-2 中 的 
两 棵 子 树 其 实 就 可 以 理解 为 森林 。 


对 比 线性 表 与 树 的 结构 ， 它 们 有 很 大 的 不 同 ， 如 图 6-2-7 所 示 。 


ΕΛΑ: ΛΙΝ EGA: 133, HES 
"最 后 一 个 数据 元 素 : 1 HAA: ΧΙΙ, Πλ} 
中间 元 素 ， ΜΙΑ ΠΒ ΟΦ ή 


图 6-2-7 
6.3” 树 的 抽象 数据 类 型 


相对 于 线性 结构 ， 树 的 操作 就 完全 不 同 了 ， 这 里 我 们 给 出 一 些 基 本 和 
党 用 操作 。 


ADT 树 (tree) 


Data 

树 是 由 一 个 根 结 点 和 若干 棵 子 树 构成 。 树 中 结 点 具有 相同 数据 类 型 及 层次 关系 。 
Operation 

InitTree(*T): 构造 空 树 T。 

DestroyTree(*T): 销毁 树 T。 


CreateTree(*T, definition): 按 definition 中 给 出 树 的 定义 来 构造 树 。 


ClearTree(*T): 若 树 T 存 在 ， 则 将 树 T 清 为 空 树 。 
TreeEmpty(T): 若 T 为 空 树 ， 返 回 true， 和 否则 返回 false。 


TreeDepth(T) : 返回 T 的 深度 。 


Root(T): 返回 T 的 根 结 点 。 


Value(T, cur_e): cur_e 是 树 T 中 一 个 结 点 ， 返 回 此 结 点 的 值 。 
Assign(T, cur_e, value): 给 树 T 的 结 点 cur_e 赋 值 为 value。 
Parent(T, cur_e): 车 cur_e 是 树 T 的 非 根 结 点 ， 则 返回 它 的 双亲 ， 否 则 返回 空 。 
LeftChild(T, cur_e): 车 cur_e 是 树 T 的 非 叶 结 点 ， 则 返回 它 的 最 左 孩 子 ， 否 则 返回 空 。 
RightSibling(T, cur_e): 若 cur _e 有 右 兄 弟 ， 则 返回 它 的 右 见 弟 ， 和 否则 返回 空 。 
InsertChild(*T, *p, i, ο): 其 中 p 指 向 树 T 的 某 个 结 点 ，i 为 所 指 结 点 p 的 度 加 上 1 

非 空 树 c 与 T 不 相交 ， 操 作 结 果 为 插入 c 为 树 T 中 p 指 结 点 的 第 i 棵 子 
DeleteChild(*T, *p, i): 其 中 p 指 向 树 T 的 某 个 结 点 ，i 为 所 指 结 点 p 的 度 ， 

操作 结果 为 删除 T 中 p 所 指 结 点 的 第 i 棵 子 树 。 
endADT 


64 树 的 存储 结构 


ο A ae 


先 来 看 看 顺序 存储 结构 ， 用 一 段 地 址 连续 的 存储 单元 依次 存储 线性 表 
和 
AWE? 


ἘΜ ΠΠ 28 ΗΠ ΒΕΓ AE TS, AMERRE, FCT A RH PT 
PATA a Re a ER, ART AMEME RARER 
R, MERE, ἘΠ: ΚΚ, EEENR, WEE MENIAL 
ΠΕ; 简单 的 顺序 存储 结构 是 不 能 满足 树 的 实现 要 求 的 。 


不 过 充分 利用 顺序 存储 和 链 式 存储 结构 的 特点 ， 完 全 可 以 实现 对 树 的 
存储 结构 的 表示 。 我 们 这 里 要 介绍 三 种 不 同 的 表示 法 : 双亲 表示 法 、 
孩子 表示 法 、 孩 子 兄弟 表示 法 。 

6.4.1 ”双亲 表示 法 


我 们 人 可 能 因为 种 种 原因 ， 没 有 孩子， 但 无 论 是 谁 都 不 可 能 是 从 石头 
里 踢 出 来 的 ， 孙 悟空 显然 不 能 算是 人 ， 所 以 古人 一 定 会 有 父母 。 树 这 


种 结构 也 不 例外 ， 除 了 根 结 点 外 ， 其 余 每 个 结扎 ， 它 不 一 定 有 孩子 ， 
但 是 一 定 有 且 仅 有 一 个 双亲。 


我 们 假设 以 一 组 连续 空间 存储 树 的 结 点 ， 同 时 在 每 个 结 点 中 ， 附 设 一 
个 指示 噩 指示 其 双 杀 结 点 在 数组 中 的 位 置 。 也 束 是 说 ， 每 个 结 点 除了 
知道 目 己 征 谁 以 外 ， 还 知道 它 的 双 杀 在 哪里 。 它 的 结 点 结构 为 表 6-4-1 
所 示 。 


表 6-4-1 


data parent 


其 中 data 古 数据 域 ， 存 储 结 点 的 数据 信息 。 而 parent 十 指针 域 ， 存 储 该 
结 点 的 双 杀 在 数组 中 的 下 标 。 


以 下 是 我 们 的 双亲 表示 法 的 结 点 结构 定义 代码 。 


/* 树 的 双亲 表示 法 结 点 结构 定义 */ 


#define ΜΑΧ ΤΚΕΕ SIZE 100 


PA 树 结 点 的 数据 类 型 ， 前 暂 为 整 型 */ 


typedef int TElemType; 
/* 结 点 结构 */ 
typedef struct PTNode 


i 


/* 结 点 数据 */ 


TElemType data; 


AE 


int parent; 


} PTNode; 


/* ΜΔ */ 


typedef struct 


f 
(a E 
PTNode nodes[MAX_TREE_SIZE]; 
/* 根 的 位 置 和 结 点 数 */ 
Ine πο πι 
FePinee? 
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是 没有 双亲 的 ， 所 以 我 们 约定 根 结 点 的 位 置 域 设 置 为 -1， 这 也 就 意味 
着 ， 我 们 所 有 的 结 点 都 存 有 它 双 亲 的 位 置 。 如 图 6-4-1 中 的 树 结构 和 表 
6-4-2 中 的 树 双亲 表示 所 示 。 


图 6-4-1 


表 6-4-2 


下 标 data parent 


0 A -1 
1 B 0 
2 cmo 
3 D 1 
4 E 2 
5 F 2 
6 © 5 
7 H 3 
8 I 3 
9 J 4 


这 样 的 存储 结构 ， 我 们 可 以 根据 结 点 的 parent 指 针 很 容易 找到 它 的 双亲 
结 点 ， 所 用 的 时 间 复 杂 度 为 0(1)， 直 到 parent 为 -1 时 ， 表 示 找 到 了 树 结 
τ FAR AE NF ETA, ARE, ΓΗ ES 
结构 才 行 。 


这 真是 麻烦 ， 能 不 能 改进 一 下 呢 ? 
当然 可 以 。 我 们 增加 一 个 结 点 最 左边 孩子 的 域 ， 不 妨 叫 它 长 子 域 ， 这 


样 束 可 以 很 容易 得 到 结 点 的 孩子 。 如 采 没 有 孩子 的 结 点 ， 这 个 长 子 域 
束 设 置 为 -1， 如 表 6-4-3 所 示 。 


表 6-4-3 


对 于 有 0 个 或 1 个 孩子 结 点 来 说 ， 这 样 的 结构 站 解决 了 要 找 结 点 孩子 的 
问题 了 。 甚 至 是 有 2 个 驴子 ， 知 道 了 长 于 是 谁 ， 男 一 个 当然 束 是 次 子 
Τ 5 


男 外 一 个 问题 场景 ， 我 们 很 关注 各 兄 第 之 间 的 关系， 双亲 表示 法 无 法 
体现 这 样 的 关系 ， 那 我 们 怎么 办 ? 咽 ， 可 以 增加 一 个 右 兄弟 域 来 体现 
UHRA, Hebe, δ΄“ “πε ΣΕΠ, MER Fat 
第 的 下 标 。 同 样 的 ， 如 采 右 兄 种 不 存在 ， 则 赋值 为 -1， 如 表 6-4-4 所 
ZR 5 
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表 6-4-4 


但 如 果 结 点 的 孩子 很 多 ， 超 过 了 2 个 。 我 们 又 关注 结 点 的 双 杀 、 义 关注 
结 点 的 孩子 、 还 关注 结 点 的 兄 第 ， 而 且 对 时 间 裔 历 要 求 还 比较 高 ， 那 
么 我 们 还 可 以 把 此 结构 扩展 为 有 双亲 域 、 长 子 域 、 再 有 右 兄 第 域 。 存 
储 结构 的 设计 是 一 个 非常 灵活 的 过 程 。 一 个 存储 结构 设计 得 苹 合 合 
理 ， 取 决 于 基于 该 存储 结构 的 运算 是 否 适 合 、 是 否 方便 ， 时 间 复 杂 度 
好 不 好 等 。 注 意 也 不 是 越 多 越 好 ， 有 需要 时 再 设计 相应 的 结构 。 吕 像 
再 好 听 的 音乐 ， 不 售 反 复 听 上 于 电 也 会 腻 味 ， 再 好 看 的 电影 ， 一 段 时 
间 反 复 看 上 百 退 ， 也 会 无 趣 ， 你 们 说 是 吧 ? 


6.4.2 ”孩子 表示 法 

换 一 种 完全 不 同 的 考 虚 方 法。 由 于 树 中 每 个 结 点 可 能 有 多 棵 子 树 ， 可 
以 考虑 用 多 重 链表 ， 即 每 个 结 点 有 多 个 指针 域 ， 其 中 每 个 指针 指向 一 
棵 子 树 的 根 结 点 ， 我 们 把 这 种 方法 叫做 多 重 链表 表示 法 。 不 过 ， 树 的 
每 个 结 点 的 度 ， 也 就 是 它 的 孩子 个 数 是 不 同 的 。 所 以 可 以 设计 两 种 方 
案 来 解决 。 

Ha 


一 种 是 指针 域 的 个 数 就 等 于 树 的 度 ， 复 习 一 下 ， 树 的 度 是 树 各 个 结 点 
度 的 最 大 值 。 其 结构 如 表 6-4-5 所 示 。 
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表 6-4-5 
其 中 data 是 数据 域 。child1 到 childd 是 指针 域 ， 用 来 指向 该 结 点 的 孩子 结 
ΓΗ ο 


对 于 图 6-4-1 的 树 来 说 ， 树 的 度 是 3， 所 以 我 们 的 指针 域 的 个 数 是 3， 这 
种 方法 实现 如 图 6-4-2 所 示 。 
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图 6-4-2 

这 种 方法 对 于 树 中 各 结 点 的 度 相 差 很 大 时 ， 显 然 是 很 浪费 空间 的 ， 因 
为 有 很 多 的 结 点 ， 它 的 指针 域 都 是 空 的 。 不 过 如 果树 的 各 结 点 度 相 差 
很 小 时 ， 那 束 意 味 着 开辟 的 空间 被 充分 利用 了 ， 这 时 存储 结构 的 缺点 
反而 变 成 了 优点 。 


既然 很 多 指针 域 都 可 能 为 空 ， 为 什么 不 按 需 分 配 空间 呢 。 于 是 我 们 有 
了 第 二 种 方案 。 
πει 


第 二 种 方案 每 个 结 点 指针 域 的 个 数 等 于 该 结 点 的 度 ， 我 们 专门 取 一 个 
位 置 来 存储 结 点 指针 域 的 个 数 ， 其 结构 如 表 6-4-6 所 示 。 
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6-4-6 


Ἡ ηπάαια WAGER, degree WEER, EMET AEAT AAA 
数 ，child1 到 childd 为 指针 域 ， 指 同 该 结 点 的 各 个 孩子 的 结 点 。 


对 于 图 6-4-2 的 树 来 说 ， 这 种 方法 实现 如 图 6-4-3 所 示 。 
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图 6-4-3 


这 种 方法 克服 了 淄 费 空间 的 缺点 ， 对 空间 利用 率 是 很 高 了 ， 但 是 由 于 
各 个 结 点 的 链表 是 不 相同 的 结构 ， 加 上 要 维护 结 点 的 度 的 数值 ， 在 运 
算 上 就 会 市 来 时 间 上 的 损耗 。 
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仔细 观察 ， 我 们 为 了 要 遍历 整 棵 树 ， 把 每 个 结 点 放 到 一 个 顺序 存储 结 
构 的 数组 中 有 是 合理 的 ， 但 每 个 结 点 的 孩子 有 多 少 是 不 确定 的 ， 所 以 我 
们 再 对 每 个 结 点 的 孩子 建立 一 个 单 链表 体现 它们 的 关系 。 


这 束 生 我 们 要 讲 的 孩子 表示 法 。 具 体 办 法 是 ， 把 每 个 结 点 的 孩子 结 点 
排列 起 来 ， 以 单 链表 作 存 储 结构 ， 则 mn 个 结 点 有 n 个 孩子 链表 ， 如 果 是 
叶子 结 点 则 此 单 链表 为 空 。 人 然后 n 个 头 指针 又 组 成 一 个 线性 表 ， 采 用 顺 
序 存储 结构 ， 存 放 进 一 个 一 维 数 组 中 ， 如 图 6-4-4 所 示 。 
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图 6-4-4 


为 此 ， 设 计 两 种 结 点 结构 ， 一 个 是 孩子 链表 的 孩子 结 点 ， 如 表 6-4-7 所 
ην 5 


表 6-4-7 


child next 


其 中 child 是 数据 域 ， 用 来 存储 某 个 结 点 在 表 头 数组 中 的 下 标 。next 是 指 
针 域 ， 用 来 存储 指 网 茶 结 点 的 下 一 个 孩子 结 点 的 指针 。 


男 一 个 是 表 头 数组 的 表 头 绪 点 ， 如 表 6-4-8 所 示 。 


表 6-4-8 


data firstchild 


其 中 data 是 数据 域 ， 存 人 铺 某 结 点 的 数据 信息 。firstchild 是 头 指 针 域 ， 存 
储 该 结 点 的 孩子 链表 的 头 指针 5 


以 下 是 我 们 的 孩子 表示 法 的 结构 定义 代码 。 


/* 树 的 孩子 表示 法 结构 定义 */ 
#define MAX_TREE_SIZE 100 


is ρα κα οι gas 


typedef struct CTNode 
{ 
int child; 
struct CTNode *next; 


+ *ChildPtr; 


/* 表 头 结构 */ 
typedef struct 
{ 
TElemType data; 
ChildPtr firstchild; 
} CTBox; 
/* 树 结构 */ 
typedef struct 
τ 
"ΗΕ 


CTBox nodes[MAX_TREE_SIZE]; 


/* 根 的 位 置 和 结 点 数 */ 


ΠΠ ΠΠ} 


} CTree; 


这 样 的 结构 对 于 我 们 要 查找 茶 个 结 点 的 茶 个 孩子 ， 或 者 找 菜 个 结 点 的 
兄弟 ， 只 需要 查找 这 个 结 点 的 孩子 单 链 表 即 可 。 对 于 允 历 整 棵 树 也 是 
很 方便 的 ， 对 头 结 点 的 数组 循环 即 可 。 


但 是 ， 这 也 存在 着 问题 ， 我 如 何 知道 某 个 结 点 的 双亲 是 谁 呢 ? 比较 麻 
烦 ， 需 要 整 棵 树 遍历 才 行 ， 难 道 就 不 可 以 把 双亲 表示 法 和 孩子 表示 法 
综合 一 下 吗 ? 当然 是 可 以 。 如 图 6-4-5 所 示 。 


下 标 data parent firstchild child next 
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图 6-4-5 


我 们 把 这 种 方法 称 为 双亲 孩子 表示 法 ， 应 该 算是 孩子 表示 法 的 改进 。 
ο ΟΥ 
p [ο) 

6.4.3 ”孩子 兄弟 表示 法 

刚才 我 们 分 别 从 双亲 的 角度 和 从 孩子 的 角度 研究 树 的 存储 结构 ， 如 果 
我 们 从 树 结 点 的 兄弟 的 角度 考虑 又 会 如 何 呢 ? 当然 ， 对 于 树 这 样 的 层 
级 结构 来 说 ， 只 研究 结 点 的 兄弟 是 不 行 的 ， 我 们 观察 后 发 现 ， 任 意 一 
棵 树 ， 它 的 结 点 的 第 一 个 孩子 如 果 存 在 就 是 唯一 的 ， 它 的 右 兄 弟 如 果 
存在 也 是 唯一 的 。 因 此 ， 我 们 设置 两 个 指针 ， 分 别 指向 该 结 点 的 第 一 
个 孩子 和 此 结 点 的 右 兄 弟 。 


结 点 结构 如 表 6-4-9 所 示 。 


表 6-4-9 


data firstchild rightsib 


其 中 data 是 数据 域 ，firstchild 为 指针 域 ， 存 储 该 结 点 的 第 一 个 孩子 结扎 
ΤΙ ας 


结构 定义 代码 如 下 。 


/* 树 的 孩子 兄弟 表示 法 结构 定义 */ 
typedef struct CSNode 
ή 


TElemType data; 


struct CSNode *firstchild, 
*rightsib; 


} CSNode, *CSTree; 


对 于 图 6-4-1 的 树 来 说 ， 这 种 方法 实现 的 示意 图 如 图 6-4-6 所 示 。 
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图 6-4-6 


这 种 表示 法 ， 给 查找 某 个 结 点 的 某 个 孩子 带 来 了 方便 ， 只 需要 通过 
fistchild 找 到 此 结 点 的 长 季 ， 然 后 再 通过 长 子 结 点 的 rightsib 找 到 它 的 二 


第 ， 接 着 一 直下 去 ， 直 到 找到 具体 的 孩子 。 当 然 ， 如 果 想 找 某 个 结 点 
的 双 杀 ， 这 个 表示 法 也 是 有 缺陷 的 ， 那 怎么 办 呢 ? 


呵呵 ， 对， 如 有 宁 真 的 有 必要 ， 完 全 可 以 再 增加 一 个 parent 指 针 域 来 解决 
快速 查找 双 杀 的 问题 ， 这 里 吏 不 再 细 谈 了 。 


其 实 这 个 表示 法 的 最 大 好 处 钙 它 把 一 标 复 洒 的 树 变 成 了 一 棵 二 文 树 。 
我 们 把 图 6-4-6 灾 变 形 就 成 了 图 6-4-7 这 个 样子 。 
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图 6-4-7 


这 样 束 可 以 充分 利用 二 义 树 的 特性 和 算法 来 处 理 这 棵 树 了 。 咽 ? 有 人 
问 ， 二 又 树 是 什么 ? 哈哈 ， 别 急 ， 这 正 是 我 接 下 来 要 重点 讲 的 内 容 。 


65 ”二叉树 的 定义 

现在 我 们 来 做 个 游戏 ， 我 在 纸 上 已 经 写 好 了 一 个 100 以 内 的 正 整 数 数 

字 ， 请 大 家 想 办 法 猜 出 我 写 的 是 哪 一 个 ?注意 你 们 猜 的 数字 不 能 超过 7 
个 ， 我 的 回答 只 会 告诉 你 是 “大 了 ”或 “小 了 ”。 

这 个 游戏 在 一 些 电视 节目 中 ， 猜 测 一 些 商 品 的 定价 时 销 会 使 用 。 我 看 
到 过 有 些 人 是 一 点 一 点 的 数字 款 加 的 ， 比 如 5、10、15、20 这 样 猜 ， 这 
ο ο πο 


其 实 这 是 一 个 很 经 典 的 折 半 查找 算法 。 如 有 果 我 们 用 图 6-5-1 〈 下 三 层 省 
略 ) 的 办 法 ， 就 一 定 能 在 7 次 以 内 ， 猜 出 结果 来 。 
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由 于 是 100 以 内 的 正 整数 ， 所 以 我 们 先 猜 50 (100 的 一 半 ) ， 被 告 之 “大 
T”, 于 是 再 猜 25 (50οῇῚ--) ， 被 告 之 “小 了 ” F837 《25 与 50 的 中 
间 数 ) ， 小 了 ， 于 是 猜 43， 大 了 ，40,， 大 了 ，38， 小 了 ，39， 完 全 正 
确 。 过 程 如 表 6-5-1 所 示 。 
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表 6-5-1 
我 们 发 现 ， 如 果 用 这 种 方式 进行 查找 ， 效 率 
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图 6-5-2 


6.5.1 二叉树 特点 
二 又 树 的 特点 有 : 


。 每 个 结 点 最 多 有 两 棵 子 树 ， 所 以 二 又 树 中 不 存在 度 大 于 2 的 结 点 。 
注意 不 是 只 有 两 棵 子 树 ， 而 是 最 多 有 “。 没 有 子 树 或 者 有 一 棵 子 树 
都 是 可 以 的 。 

ο 左 子 树 和 右 子 树 是 有 顺序 的 ， 次 序 不 能 任意 颠倒 。 就 像 人 有 双 
手 、 双 脚 ， 但 显然 左手 、 左 脚 和 右手 、 右 脚 是 不 一 样 的， 右手 戴 
左手 套 、 右 脚 罕 左 圣 都 会 极其 别扭 和 难受 。 

ο 即使 树 中 某 结 点 只 有 一 棵 子 树 ， 也 要 区 分 它 古 左 子 树 还 是 右 于 
树 。 图 6-5-3 中 ， 树 1 和 树 2 是 同一 哥 树 ， 但 它们 却 是 不 同 的 二 叉 
树 。 束 好 像 你 一 不 小 心 ， 控 伤 了 手 ， 伤 的 是 左手 还 是 右手 ， 对 你 
的 生活 影响 度 是 完全 不 同 的 。 
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二 叉 树 具有 五 种 基本 形态 : 15-- ΧΡ» 2. 只 有 一 个 根 结 点 。 3. 根 结 
。4. 根 结 点 只 有 右 子 树 。 5. 根 结 点 既 有 左 子 树 又 有 右 于 
Tt ο 


应 该 说 这 五 种 形态 还 是 比较 好 理解 的 ， 那 我 现在 癌 大 家 ， 如 果 征 有 三 
MARAT, AJLETEAS? 如 果 征 有 三 个 结 点 的 二 又 树 ， 考 虑 一 下 ， 

又 有 几 种 形态 ? 

右 只 从 形态 上 考虑 ， 三 个 结 点 的 树 只 有 两 种 情况 ， 那 束 是 图 6-5-4 中 有 
两 层 的 树 1 和 有 三 层 的 后 四 种 的 任意 一 种 ， 但 对 于 二 又 树 来 说 ， 由 于 要 
κα ο ο ο κ ον 
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图 6-5-4 
6.5.2 ”特殊 二 叉 树 


我 们 再 来 介绍 一 些 特殊 的 二 叉 树 。 这 些 树 可 能 暂时 你 不 能 理解 它 有 什 
么 用 处 ,但 先 了 解 一 下 ， 以 后 会 提 到 它们 的 实际 用 途 。 


1. RH 


顾名思义 ， 和 斜 树 一 定 要 是 斜 的 ， 但 是 往 哪 斜 还 是 有 讲究 。 所 有 的 结 点 
都 只 有 左 子 树 的 二 又 树 叫 左 斜 树 。 所 有 结 点 都 是 只 有 右 子 树 的 二 又 树 
叫 右 斜 树 。 这 两 者 统称 为 斜 树 。 图 6-5-4 中 的 树 2 就 是 左 斜 桂 ， 树 5 就 是 
右 斜 树 。 和 斜 权 有 很 明显 的 特点 ， 就 是 每 一 层 都 只 有 一 个 结 点 ， 结 点 的 
个 数 与 二 又 树 的 深度 相同 。 


有 人 会 想 ， 这 也 能 叫 树 呀 ， 与 我 们 的 线性 表 结 构 不 是 一 样 吗 。 对 的 ， 
其 实 线性 表 绪 构 殉 可 以 理解 为 是 岩 的 一 种 极其 特殊 的 表现 形式 。 


2. Χα 

DAVE AB: AARAA, HARARE, KETER” ο 15 
思 束 是 完美 是 理想 ， 不 完美 才 是 人 生 。 我 们 通常 常 举 的 例子 也 都 是 左 高 
右 低 、 参 差 不 齐 的 二 又 树 。 那 是 否 存在 完美 的 二 又 树 呢 ? 


有 同学 已 经 在 空中 手指 比划 起 来 。 对 的 ， 完 美的 二 义 树 是 存在 


在 一 棵 二 又 树 中 ， 如 果 所 有 分 文 结 点 都 存在 左 子 树 和 右 子 树 ， 并 且 所 
有 叶子 都 在 同一 层 上 ， 这 样 的 二 又 树 称 为 满 二 又 树 。 


图 6-5-5 就 是 一 棵 满 二 叉 树 ， 从 样子 上 看 就 感觉 它 很 完美 。 


图 6-5-5 


征 每 个 结 点 都 存在 左右 子 树 ， 不 能 算是 满 二 又 树 ， 还 必须 要 所 有 的 
叶子 都 在 同一 层 上 ， 这 束 做 到 了 整 柠 树 的 乎 衡 。 因 此 ， 满 二 又 树 的 特 


点 有 : (1) 叶子 只 能 出 现在 最 下 一 层 。 出 现在 其 他 层 就 不 可 能 达成 平 
{ο (2) 非 叶 子 结 点 的 度 一 定 是 2。 否 则 就 是 “ 铅 腹 膊 少 腿 *” 了 。 (3) 
在 同样 深度 的 二 又 树 中 ， 满 二 又 树 的 结 点 个 数 最 多 ， 叶 子 数 最 多 。 
3. 完全 二 又 树 

对 一 棵 具有 n 个 结 点 的 二 叉 树 按 层 序 编号 ， 如 果 编 号 为 ; (1<i<n) 的 结 
点 与 同样 深度 的 满 二 又 树 中 编号 为 的 结 点 在 二 又 树 中 位 置 完 全 相同 ， 
则 这 棵 二 又 树 称 为 完全 二 又 树 ， 如 图 6-5-6 所 示 。 


图 6-5-6 

这 是 一 种 有 些 理解 难度 的 特殊 二 又 树 。 

首先 从 字面 上 要 区 分 ,“ 完 全” 和“* 满 ?的 差异 ， 满 二 又 树 一 定 是 一 棵 完全 
二 又 树 ， 但 完全 二 又 树 不 一 定 是 满 的 。 


其 次 ， 完 全 二 叉 树 的 所 有 结 点 与 同样 深度 的 满 二 叉 树 ， 它 们 按 层 序 编 
号 相同 的 结 点 ， 是 一 一 对 应 的 。 这 里 有 个 关键 词 是 按 层 序 编号 ， 像 图 6- 


5-7 中 的 树 1， 因 为 5 结 点 没有 左 子 树 ， 却 有 右 子 树 ， 那 就 使 得 按 层 序 编 
号 的 第 10 个 编号 空 档 了 人。 同样 道理 ， 图 6-5-7 中 的 树 2， 由 于 3 结 点 没有 
子 树 ， 所 以 使 得 6、7 编 号 的 位 置 空 档 了 。 图 6-5-7 中 的 树 3 义 是 因为 5 编 
号 下 没有 了 于 树 造 成 第 10 和 第 11 位 置 空 档 。 只 有 图 6-5-6 中 的 树 ， 尽 管 它 
不 是 满 二 义 树 ， 但 是 编号 是 连续 的 ， 所 以 它 是 完全 二 又 树 。 


图 6-5-7 

从 这 里 我 也 可 以 得 出 一 些 完 全 二 又 树 的 特点 : (1) 叶子 结 点 只 能 出 现 
在 最 下 两 层 。 (2) 最 下 层 的 叶子 一 定 集中 在 左 部 连续 位 置 。 (3) 倒 
数 二 层 ， 若 有 了 叶子 结 点 ， 一 定 都 在 右 部 连续 位 置 。 (4) 如 果 结 点 度 为 
1， 则 该 结 点 只 有 左 孩 子 ， 即 不 存在 只 有 右 子 树 的 情况 。 (5) 同样 结 
点 数 的 二 又 树 ， 完 全 二 又 树 的 深度 最 小 。 

从 上 面 的 例子 ， 也 给 了 我 们 一 个 判断 茶 二 又 树 是 否 是 完全 二 又 树 的 办 
法 ， 那 驶 是 看 着 树 的 示意 图 ， 心 中 默默 给 每 个 结 点 按照 满 二 又 树 的 结 
构 逐 层 顺 序 编号 ， 如 果 编 号 出 现 空 档 ， 束 说 明 不 是 完全 二 义 树 ， 否 则 
WUE 5 

6.6 ”二 义 树 的 性 质 

二 叉 树 有 一 些 需 要 理解 并 记 住 的 特性 ， 以 便于 我 们 更 好 地 使 用 它 。 
6.6.1 ”二叉树 性 质 1 

性 质 1: 在 二 义 树 的 第 i 层 上 至 多 有 2i1 个 结 点 (i21) 5 

这 个 性 质 很 好 记忆 ， 观 察 一 下 图 6-5-5。 

一 层 是 根 结 点 ， 只 有 一 个 ， 所 以 2T1=20=1。 

ερ πο μας 

三 层 有 四 个 ，23-1=2?=4。 

ZAJA, 241=23=8 ° 

通过 数据 归纳 法 的 论证 ， 可 以 很 容易 得 出 在 二 叉 树 的 第 i 层 上 至 多 有 2 
ἱ-1 μα (151) 和 的 结论 :8 

6.6.2 ΛΕ 

性 质 2: 深度 为 k 的 二 义 树 至 多 有 2*-1 个 结 点 1) 5 


Ho a aH 
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注意 这 里 一 定 要 看 清楚 ， 是 2* 后 再 减 去 1， 而 不 是 2K1。 以 前 很 多 同学 
不 能 完全 理解 ， 这 样 去 记忆 ， 就 容易 把 性 质 2 与 性 质 1 给 弄 混淆 了 。 


深度 为 k 意 思 就 是 有 k 层 的 二 叉 树 ， 我 们 先 来 看 看 简单 的 。 
如 果 有 一 层 ， 人 至 多 1=21-1 个 结 点 。 

如 果 有 二 层 ， 至 多 1+2=3=2? -1 个 结 点 。 

如 果 有 三 层 ， 至 多 1+2+4=7=23 -1 个 结 点 。 

如 果 有 四 层 ， 至 多 1+2+4+8=15=24-1 个 结 点 。 


通过 数据 归纳 法 的 论证 ， 可 以 得 出 ， 如 果 有 k 层 ， 此 二 叉 树 至 多 有 2*-1 


PES 
6.6.3 — PER 


性 质 3: 对 任何 一 棵 二 又 树 T， 如 果 其 终端 结 点 数 为 no ， 度 为 2 的 结 点 数 
Any, Wing=n5+1° 


Aimee ΡΕΞ ΛΕΗΓ ΓΕΑ, MR, BRT Pe, 
R PARE REA EOWA a Γ, RIN 为 度 是 1 的 结 点 数 。 则 树 T 


结 点 总 数 nn tn +n, 5 


比如 图 6-6-1 的 例子 ， 结 点 总 数 为 10， 它 是 由 A、B、C、D 等 度 为 2 结 
点 ，F、G、H、I、J 等 度 为 0 的 叶子 结 点 和 E 这 个 度 为 1 的 结 点 组 成 。 总 
和 为 4+1+5=10。 


4 


图 6-6-1 


我 们 换个 角度 ， 再 数 一 数 它 的 连接 线 数 ， 由 于 根 结 点 只 有 分 文 出 去 ， 
没有 分 文 进入 ， 所 以 分 文 线 总 数 为 结 点 总 数 减 去 1。 图 6-6-1 就 是 9 个 分 
文 。 对 于 A、B、C、D 结 点 来 说 ， 它 们 都 有 两 个 分 支线 出 去 ， 而 E 结 点 
只 有 一 个 分 文 线 出 去 。 所 以 总 分 文 线 为 4x2+1x1=9。 


用 代数 表达 束 是 分 支线 尽数 =n-1=n 1 十 2n9，。。 因为 刚才 我 们 有 等 式 n=n 0 
+n; 十 n，， 所 以 可 推导 出 no 十 n1 十 n>5-1=n1 +21; ° 结论 就 是 n 60=n， 
TaLe 


6.6.4 ”二叉树 性 质 4 


性 质 4: 具有 n 个 结 点 的 完全 二 又 树 的 深度 为 log ,n+1| (|x| 表 示 不 大 于 x 
的 最 大 整数 ) 。 


由 满 二 又 树 的 定义 我 们 可 以 知道 ， 深 度 为 k 的 满 二 又 树 的 结 点 数 n 一 定 
是 2“-1。 因 为 这 是 最 多 的 结 点 个 数 。 那 么 对 于 n=2 -1 倒 推 得 到 满 二 又 
树 的 深度 为 k=log ; (n 十 1)， 比 如 结 点 数 为 15 的 满 二 又 树 ， 深 度 为 4。 


完全 二 又 树 我 们 前 面 已 经 所 到 ， 它 是 一 柠 具 有 n 个 结 点 的 二 又 树 ， 知 按 
层 序 编号 后 其 编号 与 同样 深度 的 满 二 又 树 中 编号 结 点 在 二 又 树 中 位 置 
完全 相同 ， 那 它 台 是 完全 二 又 树 。 也 吏 是 疯 ， 它 的 叶子 结 点 只 会 出 现 
在 最 下 面 的 两 层 。 


它 的 结 点 数 一 定 少 于 等 于 同样 深度 的 满 二 叉 树 的 结 点 数 2* -1， 但 一 定 
多 于 2k1-1。 即 满足 2k1-1<n<2k-1。 由 于 结 点 数 n 是 整数 ，n<2k-1 意 味 
fan<2*, π»2τ1.1, 意味 着 这 25421 Prva! <n<2*, 不 等 式 两 边 取 
对 数 ， 得 到 k-1<log , n<k， 而 k 作 为 深度 也 是 整数 ， 因 此 k=|log >nl+1。 


66.5 ”二叉树 性 质 5 
性 质 5: 如 果 对 一 棵 有 n 个 结 点 的 完全 二 广 树 (其 深度 为 ) 的 结 点 按 层 
ο. (从 第 1 层 到 第 层 ， 每 层 从 左 到 右 ) ， 对 任 一 结 点 i (1<i<n) 


1. 如 采 i=1， 则 结 点 征 二 又 树 的 根 ， 无 双亲 ; 如 果 i>1， 则 其 双亲 是 结 
Ho 


2 如果 2i>n， 则 结 点 ji 无 左 孩子 ( 结 点 为 叶子 结 点 ) ; 否则 其 左 孩 子 


是 结 点 2i。 
3. 如 果 2i+1>n， 则 结 点 i 死 右 孩子 ， 人 否则 其 右 孩 子 是 结 点 2i+1。 


我 们 以 图 6-6-2 为 例 ， 来 理解 这 个 性 质 。 这 是 一 个 完全 二 叉 树 ， 深 度 为 
4， 结 点 尽数 是 10。 


6-6-2 


对 于 第 一 条 来 说 是 很 显然 的 ，i=1 时 就 是 根 结 点 。i>1 时 ， 比 如 结 点 7， 
它 的 双亲 就 是 ， 结 点 9， 它 的 双亲 就 是 。 


第 二 条 ， 比 如 结 点 6， 因 为 2x6=12 超 过 了 结 点 总 数 10， 所 以 结 点 6 无 
BT 它 是 叶子 结 点 ο 同样 ， 而 结 点 5， 因 为 2x5= 人 
10， 所 以 它 的 左 孩 子 是 结 点 10。 


第 三 条 ， 比 如 结 点 5， 因 为 2x5+1=11， 大 于 结 点 总 数 10， 所 以 它 无 右 孩 
子 。 而 结 点 3， 因 为 2x3+1=7 小 于 10， 所 以 它 的 右 孩 子 是 结 点 7 4 


67 ”二叉树 的 存储 结构 

6.7.1 二叉树 顺序 存储 结构 

前 面 我 们 已 经 谈 到 了 树 的 存储 结构 ， 并 且 谈 到 顺序 存储 对 树 这 种 一 对 
多 的 关系 结构 实现 起 来 是 比较 困难 的 。 但 是 二 又 树 是 一 种 特殊 的 树 ， 
由 于 它 的 特殊 性 ， 使 得 用 顺序 存储 结构 也 可 以 实现 ο 

二 义 树 的 顺序 存储 结构 就 是 用 一 维 数 组 存储 二 叉 树 中 的 结 点 ， 并 且 结 
点 的 存储 位 置 ， 也 就 是 数组 的 下 标 要 能 体现 结 点 之 间 的 逻辑 关系 ， 比 
如 双亲 与 孩子 的 关系 ， 左 右 兄 弟 的 关系 等 。 


先 来 看 看 完全 二 又 树 的 顺序 存储 ， 一 柠 完 全 二 叉 树 如 图 6-7-1 所 示 。 


4 Ὁ @ D 
ἢ Ὁ Ὁ © 
OOC 


图 6-7-1 
ο. 存 入 到 数组 中 ， 相 应 的 下 标 对 应 其 同样 的 位 置 ， 如 图 6-7- 
Ως, 


Mm 123 4 5 67 8 9 10 
ἹΠΠΠΠΠΒΠΠΗ͂ 
图 6-7-2 


这 下 看 出 完全 二 又 树 的 优越 性 来 了 吧 。 由 于 它 定 义 的 严格 ， 所 以 用 顺 
序 结构 也 可 以 表现 出 二 又 树 的 结构 来 。 
当然 对 于 一 般 的 二 义 树 ， 尽 管 层 序 编 号 不 能 反映 逻辑 关系 ， 但 是 可 以 
将 其 按 完 全 二 又 树 编号 ， 只 不 过 ， 把 不 存在 的 结 点 设置 为 “A” 而 已 。 如 
图 6-7-3， 注 意 浅 色 结 点 表示 不 存在 9 


M123 45 67 8 9 10 


图 6-7-3 


με δώ, REIER, CREMA, HR 


要 分 配 2 


k-1 个 存储 单元 空间 ， 这 显然 是 对 存储 空间 的 浪费 ， 例 如 图 6-7-4 所 示 。 
所 以 ， 顺 序 存 储 结构 一 般 只 用 于 完全 二 又 树 。 


JOC 
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既然 顺序 存储 适用 性 不 强 ， 我 们 就 要 考虑 链 式 存 储 结构 。 二 又 树 每 个 
结 点 最 多 有 两 个 孩子 ， 所 以 为 它 设计 一 个 数据 域 和 两 个 指针 域 是 比较 
自然 的 要 法 我 们 称 这 样 的 链表 叫做 二 又 链表 。 结 点 结构 图 如 表 6-7-1 
σι, 


表 6-7-1 


Ichild data rchild 


H pPdata tjak, Ichildflrchildeh etait im, aval eats [5] Atk ΓΗ 
右 孩 子 的 指针 5 


以 下 是 我 们 的 二 叉 链 表 的 结 点 结构 定义 代码 。 


/* 二 又 树 的 二 又 链表 结 点 结构 定义 */ 


/* 结 点 结构 */ 
typedef struct BiTNode 


ἴ 


/* 结 点 数据 */ 
TElemType data; 


/* 左右 孩子 指针 */ 


struct BiTNode *lchild, *rchild; 


} BiTNode, *BiTree; 


结构 示意 图 如 图 6-7-5 所 示 。 


ΠΕΠ ΚΕΠ 
ΠΠΠΠΠΠΙΠΗΠ 


图 6-7-5 

就 如 同 树 的 存储 结构 中 讨论 的 一 样 ， 如 果 有 和 需要， 还 可 以 再 增加 一 个 
指 回 其 双亲 的 指针 域 ， 那样 束 称 之 为 三 又 链 表 。 由 于 与 树 的 存储 结构 
类 似 ， 这 里 就 不 详 述 了 

68 ”遍历 二 又 树 


6.8.1 二叉树 遍历 原理 


假设 ， 我 手头 有 20 张 100 元 的 和 2000 张 1 元 的 奖券 ， 同 时 酒 向 了 空中 ， 
大 家 比赛 看 谁 最 终 擒 的 最 多 。 如 琳 是 你 ， 你 会 坚 么 做 ? 


相信 所 有 同学 都 会 说 ， 一 定 先 捡 100 元 的 。 道 理 非常 简单 ， 因 为 擒 一 张 
100 元 等 于 1 元 的 捡 100 张 ， 效 率 好 得 不 是 一 点 点 。 所 以 可 以 得 到 这 样 的 
结论 ， 同 样 是 捡 奖券 ， 在 有 限时 间 内 ， 要 达到 最 高 效率 ， 次 序 非常 重 
要 。 对 于 二 叉 树 的 遍历 来 讲 ， 次 序 同样 显得 很 重要 。 


二 又 树 的 遍历 (traversing binary tree) 是 指 从 根 结 点 出 发 ， 按 照 某 种 次 
序 依次 访问 二 又 树 中 所 有 结 点 ， 使 得 每 个 结 点 被 访问 一 次 且 仅 被 访问 
一 次 o 


这 里 有 两 个 关键 词 : 访问 和 次 序 。 


访问 其 实 是 要 根据 实际 的 需要 来 确定 具体 做 什么 ， 比 如 对 每 个 结 点 进 
行 相关 计算 ， 输 出 打印 等 ， 它 算 作 是 一 个 抽象 操作 。 在 这 里 我 们 可 以 
简单 地 假定 访问 区 是 输出 结 点 的 数据 信息 。 


二 叉 树 的 贺 历 次 序 不 同 于 线性 结构 ， 最 多 也 束 是 从 头 至 尾 、 循 环 、 双 
可 等 简单 的 抽 历 方式 。 树 的 结 扩 之 间 不 存在 唯一 的 前 驱 和 后 继 关 系 ， 
在 访问 一 个 结 点 后 ， 下 一 个 被 访问 的 结 点 面临 着 不 同 的 选择 。 就 像 你 
人 生 的 道路 上 ， 高 考 填 志愿 要 面临 哪个 城市 、 哪 所 大 学 、 具 体 专业 等 
选择 ， 由 于 选择 方式 的 不 同 ， 过 历 的 次 序 就 完全 不 同 了 。 


图 6-8-1 
6.8.2 ”二 叉 树 遍历 方法 


二 义 树 的 过 历 方式 可 以 很 多 ， 如 采 我 们 限制 了 从 式 到 右 的 习惯 方式 ， 
那么 主要 束 分 为 四 种 : 


1. ΗΡΙ 


规则 是 若 二 又 树 为 空 ， 则 空 操 作 返回 ， 否 则 先 访问 根 结 点 ， 然 后 前 序 
遍历 左 子 树 ， 再 前 序 遍历 右 子 树 。 如 图 6-8-2 所 示 ， 遍 历 的 顺序 为 
ABDGH-CEIF 5 


— - 


— 
— — as 


图 6-8-2 


2. HAR 


规则 是 车 树 为 空 ， 则 空 操 作 返 回 ， 否 则 从 根 结 点 开始 (注意 并 不 是 先 
访问 根 结 点 ) ， 中 序 遍 历 根 结 点 的 左 子 桂 ， 然 后 是 访问 根 结 点 ， 最 后 
中 序 裔 历 右 子 树 。 如 图 6-8-3 所 示 ， 遍 历 的 顺序 为 : GDHBAE-ICF 5 
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图 6-8-3 


3. Ja AeA 


规则 是 若 树 为 空 ， 则 空 操 作 返 回 ， 和 否则 从 左 到 右 先 叶子 后 结 点 的 方式 
遍历 访问 左右 子 树 ， 最 后 是 访问 根 结 点 。 如 图 6-8-4 所 示 ， 遍 历 的 顺序 
为 : GHDBIEFCA 5 


4. ΠΡΙ 


ΙΕ ΛΙ, ΠΙΞΞΡΗΈΙΚΙΗ, AAI HE, HS 
开始 访问 ， 从 上 而 下 逐 层 遍历 ， 在 同一 层 中 ， 按 从 左 到 右 的 顺序 对 结 
点 逐个 访问 。 如 图 6-8-5 所 示 ， 允 历 的 顺序 为 : ΑΒΟΡΕΕΩΗΙ 5 


Wh, HAIL Bie ΠΙΑ TIT AVE? 


我 们 用 图 形 的 方式 来 表现 树 的 结构 ， 应 该 说 是 非常 直观 和 容易 理解 
但 是 对 于 计算 机 来 说 ， 它 只 有 循环 、 判 断 等 方式 来 处 理 ， 也 就 是 说 ， 
它 只 会 处 理 线性 序列 ， 而 我 们 刚才 提 到 的 四 种 遍历 方法 ， 其 实 都 是 在 
ΙΤ Ι τ Δα 


FaSbAN Te] A a he BE ONT ὑπ RSE ΡΙΗΙ ΣΑ, | AY DA Ea AE 
中 对 结 扩 进行 各 种 处 理 。 


6.8.3 ”前 序 遍 历 算法 


二 叉 树 的 定义 是 用 递归 的 方式 ， 所 以 ， 实 现 志 历 算法 也 可 以 采用 递 
而 且 极 其 简洁 明 了 “。 先 来 看 看 二 又 树 的 前 序 遍 历 算 法 。 代 码 如 


/* 二 义 树 的 前 序 遍历 递归 算法 */ 


void PreOrderTraverse(BiTree T) 
ος 
ΠΠ ΝΡ SS N) 


return; 


/* 显示 结 点 数据 ， 可 以 更 改 为 其 他 对 结 点 操作 */ 


printf("%c", T->data); 


/* 再 先 序 遍历 左 子 树 */ 


PreOrderTraverse(T->lchild); 


/* 最 后 先 序 遍历 右 子 树 */ 


PreOrderTraverse(T->rchild); 


} 


(Bix Be MEA ΠΠΕΗ6-8-61Ε HRT 5 ANCHER 
存储 在 内 存 当 中 。 


图 6-8-6 


那么 当 调用 PreOrderTraverse(T) 函 数 时 ， 我 们 来 看 看 程序 是 如 何 运 行 
的 。 


1. 调用 PreOrderTraverse(T)，T 根 结 点 不 为 null， 所 以 执行 printft， 打 印 
字母 A， 如 图 6-8-7 所 示 。 


图 6-8-7 


2. 调用 PreOrderTraverse(T->lchild); 访 问 了 A 结 点 的 左 孩子 ， 不 为 null， 
执行 printf 显 示 字母 B， 如 图 6-8-8 所 示 。 


图 6-8-8 


3. 此 时 再 次 递归 调用 PreOrderTraverse(T >lchild); 访 问 了 B 结 点 的 左 孩 
子 ， 执 行 printf 显 示 字 母 D， 如 图 6-8-9 所 示 。 


图 6-8-9 


4. 再 次 递归 调用 PreOrderTraverse(T>lchild); 访 问 了 D 结 点 的 左 孩 子 ， 
执行 printft 显 示 字母 H， 如 图 6-8-10 所 示 。 


图 6-8-10 


5. 再 次 递归 调用 PreOrderTraverse(T>lchild); 访 问 了 H 结 点 的 左 孩 子 ， 
此 时 因为 H 结 点 无 左 孩 子 ， 所 以 T==null， 返 回 此 函数 ， 此 时 递归 调用 
PreOrderTraverse(T>rchild); 访 问 了 H 结 点 的 右 孩 子 ，printf 显 示 字 母 K， 
如 图 6-8-11 所 示 。 


图 6-8-11 


6. 再 次 递归 调用 PreOrderTraverse(T >lchild); 访 问 了 K 结 点 的 左 孩子 ， 开 
结 点 无 左 孩 子 ， 返 回 ， 调 用 PreOrderTra-verse(T->rchild); 访 问 了 K 结 点 的 
右 孩 于 ， 也 是 null， 返 回 。 于 是 此 函数 执行 完毕 ， 返 回 到 上 一 级 递归 的 
函数 〈 即 打印 H 结 点 时 的 函数 ) ， 也 执行 完毕 ， 返 回 到 打印 结 点 D 时 的 
函数 ， 调 用 PreOrderTraverse(T>rchild); 访 问 了 D 结 点 的 右 孩 和 子 ， 不 存 
在 ， 返 回 到 B 结 点 ， 调 用 PreOrderTra-verse(T->rchild); 找 到 了 结 点 E， 打 
印字 母 E， 如 图 6-8-12 所 示 。 


图 6-8-12 


7. 由 于 结 扩 E 没 有 左右 按 子 ， REIT AA BAY AeA eC, BIAT 
完毕 ， 返回 到 最 初 的 PreOrderTraverse， 调 用 PreOrderTra-verse(T- 
>rchild); 访 问 结 上 护 A 的 右 孩 子 ， 打 印字 母 C， 如 图 6-8-13 所 示 。 


图 6-8-13 
8. 之 后 类 似 前 面 的 递归 调用 ， 依 次 继续 打印 F、I、G、J， 步 又 略 。 


Se, BUR SO ATT aI ze: AB-DHKECFIGJ ° 
Traverse(T)EHENAY, FEAR ERIMAIZITH ο 


6.8.4 ”中 序 裔 历 算法 


那么 二 叉 树 的 中 序 遍 历 算法 是 如 何 呢 ? 哈哈 ， 别 以 为 很 复杂 ， 它 和 前 
序 遍 历 算 法 仅仅 只 是 代码 的 顺序 上 的 差异 。 


/* 二 又 树 的 中 序 遍历 递 归 算法 */ 


void InOrderTraverse(BiTree T) 
{ 
αμ ΠΊΕ πε NEY 


return; 


/* PRR e ΓΡ */ 


InOrderTraverse(T->lchild) ; 


/* 显示 结 点 数据 ， 可 以 更 改 为 其 他 对 结 点 操作 */ 


printf("%c", T->data); 


/* 最 后 中 序 遍 历 右 子 树 */ 


InOrderTraverse(T->rchild) ; 


Haw, EST SE AABN BA ΕΝΑΛ ΕΠΙ Γ, WIA Ta 9 
我 们 来 看 看 当 调 用 InOrder-Traverse(T) 函 数 时 ， 程 序 是 如 何 运 行 的 。 


1. 调用 InOrderTraverse(T)，T 的 根 结 点 不 为 null， 于 是 调用 
InOrderTraverse(T->lchild); 访 问 结 点 B。 当 前 指针 不 为 null， 继 续 调 用 
InOrderTraverse(T->lchild); 访 问 结 点 D。 不 为 null， 继 续 调 用 
InOrderTraverse(T->lchild); 访 问 结 点 H。 继续 调用 InOrderTraverse(T- 
>lchild); 访 问 结 点 再 的 左 孩 子 ， 发 现 当 前 指针 为 null， 于 是 返回 。 打 印 当 
前 结 点 H， 如 图 6-8-14 所 示 。 


图 6-8-14 


2. 然后 调用 InOrderTraverse(T>rchild); 访 问 结 点 再 的 右 孩 子 K， 因 结 点 
K 无 左 孩 和子， 所 以 打印 K， 如 网 6-8-15 所 示 。 


图 6-8-15 


3. 因为 结 点 K 没 有 右 孩 子 ， 所 以 返回 。 打 印 结 点 H 函 数 执行 完毕 ， 返 
回 。 打 印字 母 D， 如 图 6-8-16 所 示 。 


图 6-8-16 


. 此 画 数 执行 完毕 ， 返 回 。 打 印字 母 B， 如 图 6-8-17 
ZR 5 


图 6-8-17 


5. 调用 InOrderTraverse(T>rchild); 访 问 结 点 B 的 右 孩子 E， 因 结 点 E 无 左 
孩子 ， 所 以 打印 E， 如 图 6-8-18 所 示 。 


图 6-8-18 
== ΕΕ, 


6. ARECAHERS, WE BABA WAT sc, RES TR 
我 们 调用 In-OrderTraverse 的 地 方 ， 打 印字 母 A， 如 图 6-8-19 所 示 。 


图 6-8-19 


7. 再 调用 InOrderTraverse(T>rchild); 访 问 结 点 A 的 右 孩 子 C， 再 递归 访 
问 结 点 C 的 左 孩子 FE， 结 点 E 的 左 孩子 LI。 因为 I 无 左 孩子 ， 打 印 I， 之 后 分 
别 打印 F、C、G、J。 步 骤 省 略 。 

综 上 ， 中 序 遍 历 这 棵 二 义 树 的 节点 顺序 是 : HKDBEAIFCGJ。 

6.8.5 Jafri Bie 


ABATE, Ja FA ΠΚ ΑΡΑ ΙΠΠΕΙΣ T e 


/* 二 义 树 的 后 序 遍 历 递 归 算 法 */ 


void PostOrderTraverse(BiTree Τ) 


{ 
SSN 


return; 


L) 


/* 先后 序 遍历 左 子 树 */ 


PostOrderTraverse(T->lchild); 


/* 再 后 序 遍 历 在 


Fit */ 


PostOrderTraverse(T->rchild); 


/* 显示 结 点 数 和 


E, ΠΓΡΑ 


更 改 为 其 


printf("%c", T->data); 


QUAI6-8-20Pt aN, MED EANET, AiR 


结 点 H 无 左 孩子 ， 再 查看 


所 以 打印 K， 返 


[Η] ο 


ZE 


2H 


他 对 结 点 操作 */ 


H 的 右 孩 子 K， 因 为 


yE 


ZH 


结 点 A-B-D-H,， 


K 无 左右 孩子 ， 


图 6-8-20 


最 终 ， 后 序 遍 历 的 结 点 的 顺序 就 是 KHDEB-IFJGCA。 同 学 们 可 以 自 
己 按照 刚才 的 办 法 得 出 这 个 结果 。 

6.8.6 ”推导 遍历 结果 

有 一 种 题目 为 了 考查 你 对 二 又 树 遍 历 的 掌握 程度 ， 是 这 样 出 题 的 。 已 
知 一 棵 二 义 树 的 前 序 遍 历 序 列 为 ABCDEF， 中 序 裔 历 序列 为 
CBAEDF， 请 问 这 棵 二 又 树 的 后 序 遍 历 结 果 是 多 少 ? 


对 于 这 样 的 题目 ， 如 果真 的 完全 理解 了 前 中 后 序 的 原理 ， 是 不 难 的 。 


三 种 遍历 都 是 从 根 结 点 开始 ， 前 序 遍 历 是 先 打 印 再 递归 左 和 右 。 所 以 
前 序 裔 历 序列 为 ABCDEF， 第 一 个 字母 是 A 被 打印 出 来 ， 就 说 明 人 A 是 根 
结 点 的 数据 。 再 由 中 序 遍 历 序列 是 CBAEDF， 可 以 知道 C 和 B 是 A 的 左 
子 树 的 结 点 ，E、D、F 是 A 的 右 子 树 的 结 点 ， 如 图 6-8-21 所 示 。 


图 6-8-21 


然后 我 们 看 前 序 中 的 C 和 B， 它 的 顺序 是 ABCDEF， 是 先 打印 B 后 打印 
C， 所 以 B 应 该 是 A 的 左 孩 子 ， 而 C 吏 只 能 是 B 的 孩子 ， 此 时 是 左 还 是 右 
孩子 还 不 确定 。 再 看 中 序 序列 是 CBAEDF，C 是 在 B 的 前 面 打 印 ， 这 就 
说 明 C 是 B 的 左 孩 子 ， 否 则 束 古 右 孩 子 了 ， 如 图 6-8-22 所 示 。 


图 6-8-22 


再 看 前 序 中 的 E、D、F， 它 的 顺序 是 ABCDEF， 那 就 意味 着 D 是 A 结 点 
的 右 孩 子 ，E 和 了 是 D 的 子孙 ， 注 意 ， 它 们 中 有 一 个 不 一 定 是 孩子 ， 还 
有 可 能 是 孙子 的 。 再 来 看 中 序 序列 是 CBAEDF， 由 于 E 在 D 的 左 侧 ， 而 F 
在 右 侧 ， 所 以 可 以 确定 E 是 D 的 左 孩 子 ，F 是 D 的 右 孩 子 。 因 此 最 终 得 到 
的 二 又 树 是 图 6-8-23 所 示 。 


图 6-8-23 


为 了 避免 推导 中 的 失误 ， 你 最 好 在 心中 递归 人 遍历， 检查 一 下 这 棵 树 的 
前 序 和 中 序 人 遍历 序列 是 否 与 题目 中 的 相同 。 


CAR RT MW, BREESE aR EDS, BRE 
CBEFDA ° 


BEX, WRATH AS, PAER, thy DA ae 
的 结果 ， 因 为 刚才 判断 了 A 绪 点 是 根 结 点 ， 那 么 它 在 后 序 序列 中 ， 一 定 
征 最 后 一 个 。 刚 才 推 导出 C 是 B 的 左 孩 子 ， 而 B 是 A 的 左 孩 子 ， 那 融 意 味 
着 后 序 序列 的 前 两 位 一 定 是 CB。 同 样 的 办 法 也 可 以 得 到 EFD 这 样 的 后 


序 顺 序 ， 最 终 就 自然 的 得 到 CBEFDA 这 样 的 序列 ， 不 用 在 草稿 上 画 树 
状 图 了 。 

反 过 来 ， 如 果 我 们 的 题目 是 这 样 : 二叉树 的 中 序 序列 是 ABCDEFG,， 后 
序 序列 是 BDCAFGE ， 求 前 序 序 列 ο 


这 次 简单 点 ， 由 后 序 的 BDCAFGE ， 得 到 下 是 根 结 点 ， 因 此 前 序 首 字母 
=| 
ELE ο 


于 是 根据 中 序 序列 分 为 两 棵 树 ABCD 和 FG， 由 后 序 序列 的 BDCAFGE,， 
知道 A 是 E 的 左 孩 子 ， 前 序 序列 目前 分 析 为 EA 5 


再 由 中 序 序列 的 ABCDEFG， 知 道 BCD 是 A 结 点 的 右 子 孙 ， 再 由 后 序 序 
列 的 BDCAFGE 知 道 C 结 点 是 A 结 点 的 右 孩 子 ， 前 序 序列 目前 分 析 得 到 
EAC ° 


中 序 序列 ABCDEFG， 得 到 B 是 C 的 左 孩子 ，D 是 C 的 右 孩 子 ， 所 以 前 序 
序列 目前 分 析 结 果 为 EACBD 。 


由 后 序 序列 BDCAFGE， 得 到 G 是 E 的 右 孩 子 ， 于 是 F 就 是 G 的 孩子 。 如 
朱 你 是 在 考试 时 做 这 道 题 目 ， 时 间 束 是 分 数 、 名 次 、 学 历 ， 那 么 你 根 
本 不 需 关 心 F 是 G 的 左 还 是 右 孩 子 ， 前 序 电 历 序列 的 最 终结 果 台 是 
EACBDGE ° 


ΠΠ 根据 中 序 序列 ABCDEFG， 是 可 以 得 出 F 是 G 的 左 孩 


从 这 里 我 们 也 得 到 两 个 二 又 树 侦 历 的 性 质 。 


ο CARTS ED Pe Aap ee), BY DAE RE PR ἈΠ o 
ο CAVE Fri SAP Ae a eo, BY DAME ARE ER ΧΡ 


但 要 注意 了 ， 已 知 前 序 和 后 序 裔 历 ， 是 不 能 确定 一 棵 二 义 树 的 ， 原 因 
也 很 简单 ， 比 如 前 序 序列 是 ABC， 后 序 序列 是 CBA。 我 们 可 以 确定 A 一 
定年 根 结 点 ， 但 接 下 来 ， 我 们 无 法 知道 ， 哪 个 结 点 是 于 子 树 ， 哪 个 是 
右 于 树 。 这 标 树 可 能 有 如 图 6-8-24 所 示 的 四 种 可 能 。 


图 6-8-24 
69 二叉树 的 建立 


说 了 半天 ， 我 们 如 何在 内 存 中 生成 一 株 二 又 链表 的 二 叉 树 呢 ? 树 都 没 
有 ， 哪 来 迄 历 。 所 以 我 们 还 得 来 谈 谈天 于 二 又 树 建 立 的 问题 。 


如 果 我 们 要 在 内 存 中 建立 一 个 如 图 6-9-1 左 图 这 样 的 树 ， 为 了 能 让 每 个 
结 点 确认 是 否 有 左右 孩子 ， 我 们 对 它 进 行 了 扩展 ， 变 成 图 6-9-1 右 图 的 
样子 ， 也 就 是 将 二 叉 树 中 每 个 结 点 的 空 指 针 引 出 一 个 虚 结 点 ， 其 值 为 
一 特定 值 ， 比 如 “#”。 我 们 称 这 种 处 理 后 的 二 又 树 为 原 二 又 树 的 扩展 二 
又 树 。 扩 展 二 叉 树 就 可 以 做 到 一 个 壳 历 序 列 确定 一 棵 二 又 树 了 。 比 如 
图 6-9-1 的 前 序 裔 历 序列 就 为 AB#D##C##。 


ae i 扩展 二 又 本 


图 6-9-1 


有 了 这 样 的 准备 ， 我 们 就 可 以 来 看 看 如 何 生 成 一 棵 二 叉 树 了 。 假 设 二 
又 树 的 结 点 均 为 一 个 字符 ， 我 们 把 刚才 前 序 遍 历 序列 AB#D 检 C 检 用 键 
盘 挨 个 输入 。 实 现 的 算法 如 下 : 


/* 按 前 序 输入 二 又 树 中 结 点 的 值 (一 个 字符 )”*/ 


/* # 表 示 空 树 ， 构 造 二 又 链表 表示 二 又 树 T。 */ 
void CreateBiTree(BiTree *T) 
{ 

TElemType ch; 


scanf("%c", &ch); 


af Ες me) 
ERNU 

else 

£ 


*T = (BiTree)malloc(sizeof(BiTNode)); 


if (!*T) 
exit (OVERFLOW) ; 


/* 生成 根 结 点 */ 


(*T)->data = ch; 
/* 构造 左 子 树 */ 
CreateBiTree(&(*T)->lchild); 


/* 构造 右 子 树 */ 


CreateBiTree(&(*T)->rchild); 


} 


其 实 建 立 二 叉 树 ， 也 是 利用 了 递归 的 原理 。 只 不 过 在 原来 应 该 是 打印 
结 点 的 地 方 ， 改 成 了 生成 结 点 、 给 结 点 赋值 的 操作 而 已 。 所 以 大 家 理 
解 了 前 面 的 志 历 的 话 ， 对 于 这 段 代码 融 不 难 理解 了 。 


6.10 ”线索 二 又 树 
6.10.1 “线索 二 又 树 原理 


我 们 现在 提倡 节约 型 社会 ， 一 切 都 应 该 节约 为 本 。 对 待 我 们 的 程序 当 

然 也 不 例外 ， 能 不 少 费 的 时 间或 空间 ， 都 应 该 考虑 节省 。 我 们 再 来 观 

察 图 6-10-1， 会 发 现 指 针 域 并 不 古 虱 充分 的 利用 了 ， 有 许 许多 多 

ο ο κος 
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图 6-10-1 


自 先 我 们 要 来 看 看 这 空 指针 有 多 少 个 呢 ? 对 于 一 个 有 n 个 结 点 的 二 义 链 
表 ， 每 个 结 点 有 指 同 左右 孩子 的 两 个 指针 域 ， 所 以 一 共 是 2n 个 指针 
域 。 而 n 个 结 点 的 二 义 树 一 共有 n-1 条 分 文 线 数 ， 也 就 是 说 ARETE 
2n-(n-1)=n+ 1 个 空 指针 域 。 比如 图 6- 10-1 有 10 个 结 点 ， 而 市 有 “A” 空 指 
针 域 为 11。 这 些 空间 不 存储 任何 事物 ， 白 白 的 浪费 着 内 存 的 资源 。 


男 一 方面 ， 我 们 在 做 遍历 时 ， 比 如 对 图 6-10-1 做 中 序 遍 历时 ， 得 到 了 
HDIBEJAFCG 这 样 的 字符 序列 ， 遍 历 过 后 ， 我 们 可 以 知道 ， 结 点 I 的 前 


驱 是 D， 后 继 是 B， 结 点 FE 的 前 豫 是 A， 后 继 是 C。 也 惑 是 说 ， 我 们 可 以 
很 清楚 的 知道 任意 一 个 结 点 ， 它 的 前 驱 和 后 继 是 哪 一 个 。 


可 是 这 是 建立 在 已 经 遍历 过 的 基础 之 上 的 。 在 二 又 链表 上 ， 我 们 只 能 
知道 每 个 结 点 指 回 其 左右 孩子 结 点 的 地 址 ， 而 不 知道 某 个 结 点 的 前 张 
是 谁 ， 后 继 是 谁 。 要 想 知道 ， 必 须 通 历 一 次 。 以 后 每 次 需要 知道 时 ， 
都 必须 先 裔 历 一 次 。 为 什么 不 考虑 在 创建 时 就 记 住 这 些 前 驱 和 后 继 
呢 ， 那 将 是 多 大 的 时 间 上 的 节省 。 


综合 刚才 两 个 角度 的 分 析 后 ， 我 们 可 以 考虑 利用 那些 空地 址 ， 存 放 指 
向 结 反 在 某 种 遍历 次 序 下 的 前 驱 和 后 继 结 点 的 地 址 。 就 好 像 GPS 导 航 仪 
一 样 ， 我 们 开车 的 时 候 ， 哪 怕 我 们 对 具体 目的 地 的 位 置 一 无 所 知 ， 但 
它 每 次 都 可 以 告诉 我 从 当前 位 置 的 下 一 步 应 该 走 同 哪里 。 这 束 古 我 们 
现在 要 人 研究 的 问题 。 我 们 把 这 种 指向 前 驱 和 后 继 的 指针 称 为 线索 ， 加 
上 线索 的 二 叉 链 表 称 为 线索 链表 ， 相 应 的 二 义 树 束 称 为 线索 二 叉 树 
(Threaded Binary Tree) 


请 看 图 6-10-2， 我 们 把 这 棵 二 又 树 进行 中 序 遍 历 后 ， 将 所 有 的 空 指 针 域 
中 的 rchild， 改 为 指向 它 的 后 继 结 点 。 于 是 我 们 就 可 以 通过 指针 知道 H 
的 后 继 是 D (图 中 Q)) ， 芍 后 继 是 B (AHO) ，J 的 后 继 是 E (图 中 
©) ，E 的 后 继 是 A (KFO) ，F 的 后 继 是 C (AHO) ，G 的 后 继 因 
为 不 存在 而 指向 NULL (AO) 。 此 时 共有 6 个 空 指针 域 被 利用 。 


τῇ] ἃ 


图 6-10-2 


再 看 图 6-10-3， 我 们 将 这 棵 二 又 树 的 所 有 空 指针 域 中 的 lchild， 改 为 指 
向 当前 结 点 的 前 驱 。 因 此 H 的 前 驱 是 NULL (图 中 Q)) ,I 的 前 驱 是 D 
(AF) ，J 的 前 驱 是 B (图 中 @)) ，F 的 前 驱 是 A 〈 图 中 由) ，G 的 前 
驱 是 C (ARO) 。 一 共 5 个 空 指针 域 被 利用 ， 正 好 和 上 面 的 后 继 加 起 


来 是 11 个 。 


图 6-10-3 


通过 图 6-10-4 〈 空 心 箭头 实 线 为 前 驱 ， 虚 线 黑 箭 头 为 后 继 ) ， 就 更 容易 
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表 ， 这 样 对 我 们 的 插入 删除 结 点 、 查找 某 个 结 点 都 市 来 了 方便 。 所 以 
二 叉 树 以 某 种 次 序 明 历 使 其 变 为 线索 二 又 树 的 过 程 称 做 是 线索 
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不 过 好 事 总 是 多 磨 的 ， 问 题 并 没有 彻底 解决 。 我 们 如 何 知 道 某 一 

的 lchild 是 指 癌 它 的 左 孩 子 还 十指 癌 前 驱 ? rchild 是 指 癌 右 孩 子 还 生 指 加 
后 继 ? 比如 E 结 点 的 lchild 是 指 回 它 的 左 孩 于 J， 而 rchild 却 是 指 问 它 的 后 
AEA 5 PRPC ERE lchildeta AAP ive HK, rchilde tall aK 
个 区 分 标志 的 。 因 此 ， 我 们 在 每 个 结 点 再 增设 


子 还 是 后 继 上 是 需 
两 个 标志 域 ltag 和 rtag， 注 意 ltag 和 rtag 只 是 存放 0 或 1 数字 的 布尔 型 变 
量 ， 其 占用 的 内 存 空间 要 小 于 像 Ichild 和 rchild 的 指针 变量 。 结 点 结构 如 
表 6-10-1 所 示 。 


chilo 


表 6-10-1 


其 中 : 


。 ltag 为 0 时 指向 该 结 点 的 左 孩 子 ， 为 1 时 指向 该 结 点 的 前 驱 。 
e rtag 为 0 时 指 癌 该 结 点 的 右 孩 子 ， 为 1 时 指 癌 该 结 点 的 后 继 。 
ο 因此 对 于 图 6-10-1 的 二 又 链表 图 可 以 修改 为 图 6-10-5 的 样子 。 


图 6-10-5 
6.10.2 ”线索 二 又 树 结构 实 现 
由 此 二 又 树 的 线索 存储 结构 定义 代码 如 下 : 


ον 


* 二 又 树 的 二 又 线索 存储 结构 定义 */ 


~ 


* Link==0 表 示 指 向 左右 孩子 指针 */ 


~ 


* Thread==1 表 示 指 向 前 驱 或 后 继 的 线索 */ 


typedef enum {Link, Thread} PointerTag; 
/* 二 又 线索 存储 结 点 结构 */ 
typedef struct BiThrNode 


g 


/* 结 点 数据 */ 
TElemType data; 


/* 左右 孩子 指针 */ 


struct BiThrNode *lchild, *rchild; 
PointerTag LTag; 


/* 左右 标志 */ 


PointerTag RTag; 


} BiThrNode, *BiThrTree; 
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索 化 的 过 程 就 是 在 遍历 的 过 程 中 修改 空 指针 的 过 程 。 


中 序 电 历 线索 化 的 递归 函数 代码 如 下 : 


BiThrTree pre; /* 全 局 变量 ， 始 终 指 向 刚刚 访问 过 的 结 点 */ 


/* 中 序 遍 历 进行 中 序 线索 化 */ 


void InThreading(BiThrTree p) 
ος 
if (ϱ) 
it 
/* 递归 左 子 树 线索 化 */ 


InThreading(p->lchild) ; 


ΓΕΑ */ 


if (!p->lchild) 
£ 
/* 前 驱 线索 */ 


p->LTag = Thread; 
/* 左 孩 子 指针 指向 前 驱 */ 
p->lchild = pre; 

} 


/* 前 驱 没 有 右 孩 子 */ 


if (!pre->rchild) 
id 
/* 后 继 线索 */ 


pre->RTag = Thread; 


/* 前 驱 右 孩子 指针 指向 后 继 (当前 结 点 p) */ 


pre->rchild = p; 
} 
/* 保持 pre 指 向 p 的 前 驱 */ 
pre = p; 
/* 递归 右 子 树 线索 化 */ 


InThreading(p->rchild) ; 
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平 完全 一 样 。 只 不 过 将 本 是 打印 结 点 的 功能 改 成 了 线索 化 的 功能 。 


中 间 加 粗 部 分 代码 是 做 了 这 样 的 一 些 事 。 


if(Ip->lchild) 表 示 如 果 某 结 点 的 左 指针 域 为 空 ， 因 为 其 前 张 结 点 刚刚 访 
问 过 ， 赋 值 给 了 pre， 所 以 可 以 将 pre 赋 值 给 p->lchild， 并 修改 p- 
>LTag=Thread (也 就 是 定义 为 1) 以 完成 前 驱 结 点 的 线索 化 。 


后 继 就 要 稍稍 麻烦 一 些 。 因 为 此 时 p 结 点 的 后 继 还 没有 访问 到 ， 因 此 只 
能 对 它 的 前 驱 结 点 pre 的 右 指 针 rchild 做 判断 ，if(!pre->rchild) 表 示 如 果 为 
空 ， 则 p 就 是 pre 的 后 继 ， 于 是 pre->rchild=p， 并 有 日 设 置 pre- 
>RTag=Thread， 完 成 后 继 结 点 的 线索 化 。 
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个 双 癌 链表 结构 。 


和 双 辣 链表 结构 一 样 ， 在 二 义 树 线索 链表 上 添加 一 个 头 结 点 ， 如 图 6- 
10-6 所 示 ， 并 令 其 lchild 域 的 指针 指向 二 叉 树 的 根 结 点 (图 中 的 Q)) ， 
其 rchild 域 的 指针 指向 中 序 遍 历时 访问 的 最 后 一 个 结 点 (图 中 的 @) 5 
反之 ， 令 二 又 树 的 中 序 序列 中 的 第 一 个 结 点 中 ，lchild 域 指针 和 最 后 一 
个 结 点 的 rchild 域 指针 均 指 向 头 结 点 (图 中 的 和 (4)) 。 这 样 定义 的 好 
处 就 是 我 们 既 可 以 从 第 一 个 结 点 起 顺 后 继 进 行 表 历 ， 也 可 以 从 最 后 一 
个 结 点 起 顺 前 驱 进 行 遍历 。 


图 6-10-6 
遍历 的 代码 如 下 : 


/* T 指 向 头 结 点 ， 头 结 点 左 链 1chi1d 指 向 根 结 点 ， 


头 结 点 右 链 rchild 指 向 中 序 遍历 的 */ 


/* 最 后 一 个 结 点 。 中 序 遍 历 二 又 线索 链表 表示 的 二 
SUIT */ 


Status InOrderTraverse_Thr(BiThrTree T) 


ή 

BiThrTree p; 

/* p 指 向 根 结 点 */ 

1 

/* 空 树 或 遍历 结束 时 ，p==T */ 

while (p != T) 

{ 
/* 当 LTag==0 时 循环 到 中 序 序列 第 一 个 结 点 */ 
while (p->LTag == Link) 

p = p->lchild; 
/* 显示 结 点 数据 ， 可 以 更 改 为 其 他 对 结 点 操作 », 
printf("%c", p->data); 
while (p->RTag == Thread && p->rchild != T) 
η 
p = p->rchild; 
printf("%c", p->data); 
} 
/* p 进 至 其 右 子 树 根 */ 
p = p->rchild; 
} 
return OK; 
} 


1. 代 码 中 ， 第 4 行 ，p= 工 >lchild; 意 思 就 是 图 6-10-6 中 的 中 ， 让 p 指 同根 结 
点 开始 遍历 。 


2. 第 5 一 16 行 ，while(p!=T) 其 实意 思 就 是 循环 直到 图 中 的 约 的 出 现 ， 
时 意味 着 p 指 向 了 头 结 点 ， ο... (T 是 指向 头 结 点 的 指针 ) 
束 循环 ， 人 否则 一 直 循 环 下 去 进行 过 历 操作 。 


3.587~847, while(p->LTag==Link)iX EA, Wie FHA-B-D-H, 
此 时 H 结 点 的 LTag 不 是 Link (就 是 不 等 于 0) ， 所 以 结束 此 循环 。 


4. 第 9 行 ， 打 印 H。 
5. 第 10~-14 行 ，while(p->RTag==Thread&&p->rchild=T， 由 于 结 点 再 的 


RTag==Thread (就 是 等 于 1) ， 且 不 是 指向 头 结 点 。 因 此 打印 H 的 后 继 
D， 之 后 因为 D 的 RTag 是 Link， 因 此 退出 循环 。 


6. 第 15 行 ，p=p->rchild; 意 味 着 p 指 向 了 结 点 D 的 右 孩 子 I。 


ο ο 就 这 样 不 断 循环 遍历 ， 路 径 参 照 图 6-10-4， 直 到 打印 出 
HDIBJEAFCG, 24 Ri PEE 5 


从 这 段 代 码 也 可 以 看 出 ， 它 等 于 是 一 个 链表 的 扫描 ， 所 以 时 间 复 杂 度 
为 O(n)。 

由 于 它 充分 利用 了 空 指针 域 的 空间 (这 等 于 节省 了 空间 ) ， 又 保证 了 
创建 时 的 一 次 忆 历 就 可 以 终生 受用 前 驱 后 继 的 信息 GRRE TA Γ 
时 间 ) 。 所 以 在 实际 问题 中 ， 如 果 所 用 的 二 又 树 需 经 常 遍 历 或 查找 结 
点 时 需要 某 种 遍历 序列 中 的 前 驱 和 后 继 ， 那 么 采用 线索 二 又 链表 的 存 
储 结 构 丈 是 非常 不 错 的 选择 。 


611 树 、 和 森林 与 二 又 树 的 转换 
我 之 前 在 网 上 看 到 这 和 样 一 个 改 事 ， 不 知道 是 真 还 是 假 ， 反 正定 有 点 意 


故事 是 说 联合 利 华 引 进 了 一 条 香 电 包 帮 生产线， 结果 发 现 这 条 生产 线 
有 个 缺陷 : 各 单 会 有 盒子 里 没 半 入 香 时 。 总 不 能 把 至 盒子 卖 给 顾客 
啊 ， 他 们 只 好 请 了 一 个 学 目 动 化 的 博士 设计 一 个 方案 来 分 拒 空 的 香 电 
盒 。 博 士 组 织 成 立 了 一 个 十 几 人 的 科研 攻关 小 组 ， 综 合 采 用 了 机 械 、 
微 电 子 、 目 动 化 、X 射 线 探测 等 技术 ， 花 了 几 二 万， 成 功 解决 了 问题 。 
每 当 生 产 线 上 有 空 香 虹 盒 通过 ， 两 学 的 探测 器 会 检测 到 ， 并 且 驱 动 一 
只 机 械 手 把 空 电 盒 推 走 。 


中 国 南 方 有 个 乡镇 企业 也 买 了 同样 的 生产 线 ， 老 板 发 现 这 个 问题 后 大 
为 光 火 ， 找 了 个 小 工 来 说 : 你 把 这 个 问题 搞定 ， 不 然 老子 炒 你 鲜 鱼 。 
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这 个 故事 在 网 上 引起 了 很 大 的 和 争议， 我 相信 大 家 听 完 后 也 会 有 不 少 的 
想法 。 不 过 我 在 这 只 是 想 疯 ， 有 很 多 复杂 的 问题 都 征 可 以 有 人 商 单 办 法 
去 处 理 的 ， 在 于 你 肯 不 肯 动 脑筋 ， 在 于 你 有 没有 创新 。 


我 们 前 面 已 经 讲 过 了 树 的 定义 和 存储 结构 ， 对 于 树 来 说 ， 在 满足 树 的 
条 件 下 可 以 是 任意 形状 ， 一 个 结 点 可 以 有 任意 多 个 孩子 ， 显 然 对 树 的 
处 理 要 复杂 得 多 ， 去 研究 关于 树 的 性 质 和 算法 ， 真 的 不 容易 。 有 没有 
简单 的 办 法 解决 对 树 处 理 的 难题 呢 ? 


我 们 前 面 也 讲 了 二 义 树 ， 尽 管 它 也 是 树 ， 但 由 于 每 个 结 点 最 多 只 能 有 
墟 孩子 和 右 孩 子 ， 面 对 的 变化 融 少 很 多 了 “。 因 此 很 多 性 质 和 算法 者 被 
研究 了 出 来 。 如 果 所 有 的 树 都 像 二 又 树 一 样 方便 就 好 了 “。 你 还 别 说 ， 
真是 可 以 这 样 做 。 


入 6-11-1 


在 讲 树 的 存储 结构 时 ， 我 们 提 到 了 树 的 孩子 兄 第 法 可 以 将 一 棵 树 用 二 
又 链表 进行 存储 ， 所 以 借助 二 又 链表 ， 树 和 二 又 树 可 以 相互 进行 转 
换 。 从 物理 结构 来 看 ， 它 们 的 二 又 链表 也 是 相同 的 ， 只 是 解释 不 太一 
样 而 已 。 因 此 ， 只 要 我 们 设 定 一 定 的 规则 ， 用 二 又 树 来 表示 树 ， 甚 至 
表示 和 森林 都 是 可 以 的 ， 和 森林 与 二 又 树 也 可 以 互相 进行 转换 。 


我 们 分 别 来 看 看 它们 之 间 的 转换 如 何 进 行 。 
6.11.1 WRRA MPH 


将 树 转换 为 二 又 树 的 步骤 如 下 1. 加 线 。 在 所 有 兄弟 结 点 之 间 加 一 条 连 
线 。 DAR ON Pa MAR, ARBRE DATES RAE, 
删除 它 与 其 他 孩子 结 点 之 间 的 连 线 。 3. 层 次 调整 。 以 树 的 根 结 点 为 轴 
心 ， 将 整 棵 树 顺 时 针 旋 转 一 定 的 角度 ， 使 之 结构 层次 分 明 。 注 意 第 一 
aoe AMAA, πη RIRIA Tee AE 


ΡΙΠΗΕΗΘ6-11-2, RRE = SERRA TR O° DF BA DAE 
的 错误 吏 是 在 层次 调整 时 ， 弄 钳 了 左右 孩子 的 天 系 。 比 如 图 中 F、G 本 

都 旦 树 结 点 B 的 孩子 ， 征 结 点 E 的 兄弟 ， 因 此 转换 后 ，F 束 是 二 又 树 结 氮 
E 的 右 孩 子 ，G 十 二 又 树 结 点 E 的 右 孩 子 。 
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步骤 2， 给 除 长 子 外 的 孩子 去 线 步骤 3， 层 次 调整 


图 6-11-2 
6.11.2 ”森林 转换 为 二 又 树 


和 森林 是 由 若干 柠 树 组 成 的 ， 所 以 完全 可 以 理解 为 ， 和 森林 中 的 每 一 柠 树 
都 是 兄 弟 ， 可 以 按照 兄弟 的 处 理 办 法 来 操作 。 步 又 如 下 : 1. 把 每 个 树 
转换 为 二 又 树 。 2. 第 一 柠 二 叉 树 不 动 ， 从 第 二 柠 二 又 树 开 始 ， 依 次 把 
后 一 棵 二 又 树 的 根 结 点 作为 前 一 棵 二 又 树 的 根 结 点 的 右 孩 子 ， 用 线 连 
。 当 所 有 的 二 又 树 连 接 起 来 后 惑 得 到 了 由 森林 转换 来 的 二 又 

对 ο 


例如 图 6-11-3， 将 森林 的 三 棵 树 转化 为 一 棵 二 又 树 。 
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图 6-11-3 
6.11.3 ”二叉树 转换 为 树 


二 义 树 转 换 为 树 是 树 转 换 为 二 又 树 的 人 逆 过 程 ， 也 就 是 反 过 来 做 而 已 。 
如 图 6-11-4 所 示 。 步 又 如 下 : 1. 加 线 。 知 某 结 点 的 左 孩 子 结 点 存在 ， 则 
将 这 个 左 孩 子 的 右 孩 子 结 点 、 右 孩子 的 右 孩 子 结 点 、 右 孩子 的 右 孩 子 
的 右 孩 子 结 点 .…. 哈 ， 反 正 束 是 左 孩 子 的 n 个 右 孩 子 结 点 都 作为 此 结 点 
的 孩子 。 将 该 结 点 与 这 些 右 孩 子 结 点 用 线 连 接 起 来 。2. 去 线 。 删 除 原 
κ ος ος 。3. 层 次 调整 。 使 之 结构 层 
TEH ο 
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图 6-11-4 
6114 二叉树 转换 为 森林 


判断 一 棵 二 广 树 能 够 转换 成 一 棵 树 还 是 森林 ， 标 准 很 简单 ， 那 束 是 只 
要 看 这 棵 二 又 树 的 根 结 点 有 没有 右 孩 子 ， 有 束 是 森林 ， 没 有 就 是 一 柠 
树 。 那 么 如 果 是 转换 成 森林 ， 步 又 如 下 : 1. 从 根 结 点 开始 ， 大 右 孩子 
存在 ， 则 把 与 右 孩 子 结 点 的 连 线 删除 ， 再 查看 分 离 后 的 二 又 树 ， 寿 右 
FFE, MERMER... 直到 所 有 右 孩 子 连 线 都 删除 为 止 ， 得 到 
分 离 的 二 义 树 。2. 再 将 每 棵 分 离 后 的 二 义 树 转换 为 树 即 可 。 


ἐν 
δ 0 
val: ERTER 
κ. j 0 
59 0) μ) Ὁ) {αν 
0 


οι RNR] ΧΗ 


图 6-11-5 
6.11.5” 树 与 森林 的 遍历 
最 后 我 们 再 谈 一 谈 关 于 树 和 森林 的 遍历 问题 。 


树 的 遍历 分 为 两 种 方式 。1. 一 种 是 先 根 遍历 树 ， 即 先 访问 树 的 根 结 
点 ， 然 后 依次 先 根 遍历 根 的 每 棵 子 树 。 2. 另 一 种 是 后 根 遍 历 ， 即 先 依 
次 后 根 遍 历 每 棵 子 树 ， 然 后 再 访问 根 结 点 。 比 如 图 6-11-4 中 右 下 方 的 
树 ， 它 的 先 根 遍历 序列 为 ABEFCDG， 后 根 遍 历 序列 为 EFBCGDA 5 


森林 的 遍历 也 分 为 两 种 方式 : 1. 前 序 遍 历 : 先 访问 森林 中 第 一 棵 树 的 

根 结 点 ， 然 后 再 依次 先 根 遍历 根 的 每 棵 子 树 ， 再 依次 用 同样 方式 遍历 

除去 第 一 棵 树 的 剩余 树 构成 的 森林 。 比 如 图 6-11-5 下 面 三 棵 树 的 森林 ， 

前 序 遍 历 序 列 的 结果 就 是 ABCDEFGHJI。 2. 后 序 遍 历 : 是 先 访问 森林 

中 第 一 棵 树 ， 后 根 遍 历 的 方式 遍历 每 棵 子 树 ， 然 后 再 访问 根 结 点 ， 再 

依次 同样 方式 遍历 除去 第 一 棵 树 的 剩余 树 构 成 的 森林 。 比 如 图 6-11-5 下 
面 三 棵 树 的 森林 ， 后 序 遍 历 序列 的 结果 就 是 BCDAFEJHIG 5 


可 如 果 我 们 对 图 6-11-5 的 左 侧 三 义 树 进行 分 析 束 会 发 现 ， 和 森林 的 前 序 遍 
a je A BI Pa RA, RARE ΠΕΡ] A — SOT H ad 
力 结 末 相同。 


这 也 就 告诉 我 们 ， 当 以 二 叉 链表 作 树 的 存储 结构 时 ， 树 的 先 根 肖 历 和 
后 根 志 历 完全 可 以 借用 二 义 树 的 前 序 肖 历 和 中 序 直 历 的 算法 来 实现 。 
这 其 实 也 下 证实 ， 我 们 找到 了 对 树 和 和 森林 这 种 复杂 问题 的 简单 解决 办 
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6.12.1 {κ} 
“ΠΕ, ΠΒ, BOOTIES, RATAREA? ”我 这 有 《三 国 演 
V EFE, KEDE? om BE (Eo? (C= RVR) BF, 


你 邮件 发 给 我 ! “ΟΚ! 文件 1IM 多 大 小 ， 好 像 大 了 点 。 我 打 个 包 ， 稍 
等 ..….... 哈 哈 ， 少 了 一 半 ， 压 缩 效 琳 不符 蚜 。”“ 太 棱 了 ， 快 后 传 给 我 


OER ΧΕ 1.208 KB 
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图 6-12-1 


这 年 我 们 生活 中 彰 见 的 对 日 。 现 在 我 们 都 是 讲 完 效 率 的 社会 ， 什 么 都 
要 求 速度 ， 在 不 能 出 错 的 情 念 他 的 成 就 ， 于 是 束 把 他 在 编码 中 用 到 的 
等 殊 的 二 又 树 称 之 为 赫 夫 受 树 ， 他 的 编码 方法 称 为 赫 夫 受 编 码 。 也 了 束 
征 疯 ， 我 们 现在 介绍 的 知识 全 都 来 目 于 近 60 年 前 这 位 伟大 科学 家 的 全 
究 成 果 ， 而 我 们 乎 时 所 用 的 压缩 和 解压 缩 技 术 也 都 是 基于 赫 夫 曼 的 研 
守之 上 发 展 而 来 ， 我 们 应 该 要 记 住 他 。 


那么 压缩 而 不 出 错 是 如 何 做 到 的 呢 ? 简单 说 ， 就 是 把 我 们 要 压缩 的 文 
本 进行 重新 编码 ， 以 减少 不 必要 的 空间 。 尽 管 现 在 最 新 技术 在 编码 上 
已 经 很 好 很 强大 ， 但 这 一 切 痢 来 日 于 曾经 的 技术 积 索 ， 我 们 今天 束 来 
介绍 一 下 最 基本 的 压缩 编码 方法 一 一 赫 夫 受 编码 。 


在 介绍 赫 夫 受 编码 前 ， 我 们 必须 得 介绍 赫 夫 受 树 ， 而 介绍 赫 夫 受 树 ， 
我 们 不 得 不 提 这 样 一 个 人 ， 美 国 数学 家 赫 夫 曼 (David Huffman) ， 也 
有 的 翻译 为 哈 夫 曼 。 他 在 1952 年 发 明了 医 夫 曼 编 码 ， 为 了 纪念 他 的 成 
束 ， 于 是 束 把 他 在 编码 中 用 到 的 特殊 的 二 义 树 称 之 为 医 夫 曼 树 ， 他 的 
编码 方法 称 为 赫 夫 曼 编 码 。 也 就 是 说 ， 我 们 现在 介绍 的 知识 全 都 来 自 
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什么 叫做 赫 夫 曼 树 呢 ? 我 们 先 来 看 一 个 例子 。 


过 去 我 们 小 学 、 中 学 一 般 考 试 都 是 用 百分制 来 表示 学 科 成 绩 的 。 这 带 
来 了 一 个 弊端 ， 就 是 很 容易 让 学 生 、 家 长 ， 甚 至 老师 目 己 都 以 分 取 
人 ， 让 分 数 代表 了 一 切 。 有 了 时 想 想 也 对 ，90 分 和 95 分 也 许 就 只 是 一 道 
题目 对 错 的 差距 ， 但 却 让 两 个 孩子 可 能 受到 完全 不 同 的 待遇 ， 这 并 不 
公平 。 于 是 在 如 今 提倡 素质 教育 的 背景 下 ， 我 们 很 多 的 学 科 ， 特 别 是 
小 学 的 学 科 成 绩 都 改作 了 优秀 、 民 好 、 中 等 、 及 格 和 不 及 格 这 样 模糊 
的 词语 ， 不 再 通报 具体 的 分 数 。 


不 过 对 于 老师 来 讲 ， 他 在 对 试卷 评分 的 时 候 ， 显 然 不 能 攒 感觉 给 优 展 
或 及 格 不 及 格 等 成 绩 ， 因 此 一 般 都 还 是 按照 百分制 算出 每 个 学 生 的 成 
绩 后 ， 再 根据 统一 的 标准 换算 得 出 五 级 分 制 的 成 绩 。 比 如 下 面 的 代码 
忠实 现 了 这 样 的 转换 。 


if (a < 60) 
ο κ ας 

else if (a < 70) 
b = "Rig"; 

else if (a < 80) 


2 . 
b=" rae 


else if (a < 90) 


图 6-12-2 狙 略 看 没什么 问题 ， 可 是 通 音 都 认为 ， 一 张 好 的 考 眷 应 该 是 让 
学 生成 绩 大 部 分 处 于 中 等 或 民 好 的 范围 ， 优 秀和 不 及 格 都 应 该 较 少 
对 。 而 上 面 这 样 的 程序 ， 就 使 得 所 有 的 成 绩 都 需要 先 判 断 是 否 及 格 ， 
τ... NS aie arene 
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ΠΡ 
图 6-12-2 


ο. ποσα 学 生 的 成 绩 在 5 个 等 级 上 的 分 布 规律 如 表 6- 
12-1 所 示 。 


[1-13 


40% 


表 6-12-1 


80 ~ 89 


30% 


0) ~ 
100 
10% 


那么 70 分 以 上 大 约 占 总 数 80% 的 成 绩 都 需要 经 过 3 次 以 上 的 判断 才 可 以 


得 到 结 末 ， 这 显然 不 合理 。 


有 没有 好 一 些 的 办 法 ， 仔 细 观 察 发 现 ， 中 等 成 绩 《70~ 全 79 分 之 间 ) 比 
例 最 高 ， 其 次 是 民 好 成 绩 ， 不 及 格 的 所 占 比例 最 少 。 我 们 把 图 6-12-2 这 
柠 二 叉 树 重新 进行 分 配 。 改 成 如 图 6-12-3 的 做 法 试 试看 。 
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图 6-12-3 


从 图 中 感觉 ， 应 该 效率 要 高 一 些 了 ， 到 撒 高 多 少 呢 。 这 样 的 二 又 树 又 
征 如 何 设计 出 来 的 呢 ? 我 们 来 看 看 幸 夫 有 曼 大 板 是 如 何 说 的 吧 。 


6.12.2 MRAWELSRE 


我 们 先 把 这 两 棵 二 叉 树 简化 成 叶子 结 点 带 权 的 二 又 树 〈 注 : 树 结 点 间 
的 边 相 关 的 数 叫 做 权 Weight) ， 如 图 6-12-4 所 示 。 其 中 A 表示 不 及 格 、 
B 表 示 及 格 、C 表 示 中 等 、DD 表 示 民 好 、E 表 示 优 秀 。 每 个 叶子 的 分 文 线 
上 的 数字 了 束 是 刚才 我 们 提 到 的 五 级 分 制 的 成 绩 所 占 百 分 比 。 
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图 6-12-4 
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点 之 间 的 路 径 ， 路 径 上 的 分 支 数目 称 做 路 径 长 度 。 图 6-12-4 的 二 又 树 a 
中 ， 根 结 点 到 结 点 D 的 路 径 长 度 就 为 4， 二 又 树 b 中 根 结 点 到 结 点 D 的 路 
径 长 度 为 2。 树 的 路 径 长 度 就 是 从 树 根 到 每 一 结 点 的 路 径 长 度 之 和 。 二 
叉 树 a 的 树 路 径 长 度 就 为 1+1+2+2+3+3+4+4=20。 二 又 树 b 的 树 路 径 长 度 
就 为 1+2+3+3+2+1+2+2=16 ° 


如 果 考 虑 到 带 权 的 结 点 ， 结 点 的 带 权 的 路 径 长 度 为 从 该 结 点 到 树 根 之 
间 的 路 径 长 度 与 结 点 上 权 的 乘积 。 树 的 带 权 路 径 长 度 为 树 中 所 有 叶子 
结 点 的 带 权 路 径 长 度 之 和 。 假 设 有 n 个 权 值 {w wao wah, PEER 
有 n 个 叶子 结 点 的 二 又 树 ， 每 个 叶子 结 点 带 权 w,. ， 每 个 叶子 的 路 径 长 
度 为 1 ， 我 们 通常 记 作 ， 则 其 中 带 权 路 径 长 度 WPL 最 小 的 二 又 树 称 做 
赫 夫 曼 树 。 也 有 不 少 书 中 也 称 为 最 优 二 又 树 ， 我 个 人 觉得 为 了 纪念 做 
出 巨大 贡献 的 科学 家 ， 既 然 用 他 们 的 名 字 命 名 ， 就 应 该 要 坚持 用 他 们 
的 名 字 称呼 ， 哪 怕 “ 最 优 ?更 能 体现 这 棵 树 的 品质 也 应 该 只 作为 别名 。 


有 了 赫 夫 受 对 带 权 路 径 长 度 的 定义 ， 我 们 来 计算 一 下 图 6-12-4 这 两 棵 树 
的 WPL 值 。 


二 义 树 a 的 WPL=5x1+15x2+40x3+30x4+10x4=315 
注意 : 这 里 5 是 A 结 点 的 权 ，1 是 A 结 点 的 路 径 长 度 ， 其 他 同 理 。 
— SORT DA WPL=5*3+15x3+40x2+30x2+10x2=220 


这 样 的 结果 意味 着 什么 呢 ? 如 果 我 们 现在 有 10000 个 学 生 的 百分制 成 绩 
需要 计算 五 级 分 制 成 绩 ， 用 二 又 树 a 的 判断 方法 ， 需 要 做 31500 次 比 
较 ， 而 二 又 树 b 的 判断 方法 ， 只 需要 22000 次 比较 ， 差 不 多 少 了 三 分 之 
一 量 ， 在 性 能 上 提高 不 是 一 点 点 。 


那么 现在 的 问题 加 是 ， 图 6-12-4 的 二 又 树 b 这 样 的 树 是 如 何 构造 出 来 
A, 1. WER EMER INKS UES FB, ΠΛΗΝ 
给 了 我 们 解决 的 办 法 。 

1. 先 把 有 权 值 的 叶子 结 点 按照 从 小 到 大 的 顺序 排列 成 一 个 有 序 序列 ， 
BU: AS, E10, B15, D30, C40° 


2， 取 头 两 个 最 小 权 值 的 结 点 作为 一 个 新 节点 N 1 的 两 个 子 结 点 ， 注 意 


相对 较 小 的 是 左 孩 子 ， 这 里 就 是 A 为 N | 的 左 孩 子 ，E 为 N | WART, 
如 图 6-12-5 所 示 。 新 结 点 的 权 值 为 两 个 叶子 权 值 的 和 5+10=15。 


到 6-12-5 

3. N 替换 A 与 E， 插 入 有 序 序列 中 ， 保 持 从 小 到 大 排列 。 即 : N 1 
15, B15, D30, C40 ° 

4. ERIR 5 HN, 与 B 作 为 一 个 新 和 点 Ny 的 两 个 子 结 点 。 如 图 6-12- 
6 所 示 。N ,的 权 值 =15+15=30。 


色 6-12-6 

5. 将 N ,替换 N | 与 B， 插 入 有 序 序列 中 ， 保 持 从 小 到 大 排列 。 即 : N, 
30, D30, C40° 

6. 重复 步 又 2。 将 N , 与 D 作 为 一 个 新 六 上 扣 N 3 的 两 个 子 结 点 。 如 图 6-12- 
7 所 示 。N ;的 权 值 =30+30=60 5 


S Ὁ 
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图 6-12-7 
7. 将 N ; 若 换 N ,与 D， 插 入 有 序 序列 中 ， 保 持 从 小 到 大 排列 。 即 : 


C40, N360° 
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图 6-12-8 


此 时 的 图 6-12-8 二 又 树 的 带 权 路 径 长 度 
WPL=40x1+30x2+15x3+10x4+5x4=205。 与 图 6-12-4 的 二 又 树 b 的 WPL 
还 少 了 15。 显 然 此 时 构造 出 来 的 二 又 树 才 是 最 优 的 赫 夫 受 
对 ο 


不 过 现实 总 是 比 理 想 要 复杂 得 多 ， 图 6-12-8 虽 然 是 赫 夫 受 树 ， 但 由 于 每 
次 判断 都 要 两 次 比较 (如 根 结 点 就 是 a<80&&a>=70， 两 次 比较 才能 得 
到 y 或 n 的 结果 ) ， 所 以 总 体 性 能 上 ， 反 而 不 如 图 6-12-3 的 二 又 树 性 能 

高 。 当 然 这 并 不 是 我 们 要 讨论 的 重点 了 。 


通过 刚才 的 步 怠 ， 我 们 可 以 得 出 构造 圭 夫 曼 树 的 赫 夫 曼 算法 描述 。 
1. 根 据 给 定 的 n 个 权 值 {w 1,w 2,.…w,} 构 成 o 棵 二 叉 树 的 集合 F={T Ts 


a T,}， 其 中 每 棵 二 又 树 T 中 只 有 一 个 带 权 为 wi 根 结 点 ， 其 左右 子 树 
均 为 空 。 


2. 在 F 中 选取 两 柠 根 结 总 的 权 值 最 小 的 树 作为 左右 子 树 构 造 一 棵 新 的 二 


， 且 置 狐 的 二 叉 树 的 根 结 点 的 权 值 为 其 左右 子 树 上 根 结 点 的 权 值 
Πο 


3. 在 F 中 删除 这 两 棵 树 ， 同 时 将 新 得 到 的 二 又 树 加 入 F 中 。 

4. 重 复 2 和 3 步骤 ， 直 到 F 只 含 一 棵 树 为 止 。 这 棵 树 便 是 赫 夫 曼 树 。 
6.12.3 κ ΑΙ 

当然 ， 替 夫 曼 研究 这 种 最 优 树 的 目的 不 是 为 了 我 们 可 以 转化 一 下 成 

绩 。 他 的 更 大 目的 是 为 了 解决 当年 远 距 离 通 信 (主要 是 电报 ) 的 数据 
传输 的 最 优化 问题 。 

比如 我 们 有 一 段 文字 内 容 为 ‘BADCADFEED” 要 网 络 传输 给 别人 ， 显 然 
用 二 进 制 的 数字 (0 和 1) 来 表示 是 很 自然 的 想法 。 我 们 现在 这 上 段 文字 


只 有 六 个 字母 ABCDEF， 那 么 我 们 可 以 用 相应 的 二 进 制 数 据 表 示 ， 如 
表 6-12-2 所 示 。 


α ο κα 


a Ἕ]πΓπε[π]πίπ᾽ 


表 6-12-2 


这 样 真 正 传输 的 数据 就 是 编码 后 

的 “001000011010000011101100100011”， 对 方 接收 时 可 以 按照 3 位 一 分 
来 译 码 。 如 果 一 篇 文章 很 长 ， 这 样 的 二 进 制 串 也 将 非常 的 可 怕 。 而 且 
事实 上 ， 不 管 是 英文 、 中 文 或 是 其 他 语言 ， 字 母 或 汉字 的 出 现 频 率 是 
不 相同 的 ， 比 如 英语 中 的 几 个 元 音字 母 “ae io uw*"， 中 文中 的 “的 了 有 
于 "等 汉字 都 是 频率 极 高 。 


假设 六 个 字母 的 频率 为 A 27，B 8，C 15，D15，E 30，F 5， 合 起 来 正 
ώς ο ο ee 
| ο 


Al6-12-9A RAER SY A EASE ΠΙΤΕΡ ΑΕ 
改 为 0， 石 分 文 改 万 1 后 的 赫 夫 受 树 。 
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此 时 ， 我 们 对 这 六 个 字母 用 其 从 树 根 到 叶子 所 经 过 路 径 的 0 或 1 来 编 
码 ， 名 以 得 到 如 宕 6 12-3 所 示 这 样 的 定义 。 


ΒΛ ΕΙ ΡΙΣΙΕΙΕ 


ΕΠΕ ΤΕΕ] 


36-12-3 
我 们 将 文字 内 容 为 "BADCADFEED” 再 次 编码 ， 对 比 可 以 看 到 结果 串 变 


小 了 


原 编码 二 进 制 串 : 001000011010000011101100100011 (3303 
[人 
新 编码 二 进 制 串 : 1001010010101001000111100 ( 共 25 个 字符 ) 


也 束 是 疯 ， 我 们 的 数据 被 压 缩 了 ， 丰 约 了 大 约 17% 的 存储 或 传输 成 本 。 
随 着 字符 的 增加 和 多 字符 权重 的 不 同 ， 这 种 压缩 会 更 加 显 出 其 优势 。 


当 我 们 接收 到 1001010010101001000111100 这 样 压缩 过 的 新 编码 时 ， 我 
们 应 该 如 何 把 它 解 码 出 来 呢 ? 


编码 中 非 0 即 1， 长 短 不 等 的 话 其 实 是 很 容易 混 清 的 ， 所 以 徊 要 设计 长 
短 不 等 的 编码 ， 则 必须 是 任 一 字符 的 编码 部 不 是 男 一 个 字符 的 编码 的 
前 级 ， 这 种 编码 称 做 醒 缀 编码 。 


你 仔细 观察 束 会 发 现 ， 表 6-12-3 中 的 编码 束 不 存在 容易 与 1001、1000 混 
1G 的 “10” 和 [η 100” 编 码 6 


可 仅仅 是 这 样 不 足以 让 我 们 去 方便 地 解码 的 ， 因 此 在 解码 时 ， 还 是 要 
ΤΘ: 
ΜΙ 5 


当 我 们 接收 到 1001010010101001000111100 时 ， 由 约定 好 的 赫 夫 曼 树 可 
知 ，1001 得 到 第 一 个 字母 是 B， 接 下 来 01 意 味 着 第 二 个 字符 是 A， 如 图 
6-12-10 所 示 ， 其 余 的 也 相应 的 可 以 得 到 ， 从 而 成 功 解码 。 


fo fo εἲ 


人 


| . ο 


一 般 地 ， 设 需要 编码 的 字符 集 为 {d 1,d,,.…,dn}， 各 个 字符 在 电文 中 出 
现 的 次 数 或 频率 集合 为 {wl,w， wan}， 以 dl,d ,du 作为 叶子 结 
点 ， 以 wlwwn 作 为 相应 叶子 结 点 的 权 值 来 构造 一 株 赫 夫 受 树 。 
规定 赫 夫 曼 树 的 左 分 支 代表 0， 右 分 支 代表 1， 则 从 根 结 点 到 叶子 结 点 
所 经 过 的 路 径 分 文 组 成 的 0 和 1 的 序列 便 为 该 结 点 对 应 字符 的 编码 ， 这 
DEDA SAIS - 


6.13 总 结 结 回顾 


终于 到 了 总 结 的 时 间 ， 这 一 章 与 前 面 章节 相 比 ， 显 得 过 于 庞大 了 些 ， 
原因 也 就 在 于 树 的 复杂 性 和 赤 赤 化 丰富 度 是 前 面 的 线性 表 所 不 可 比拟 
的 。 即 使 在 本 章 之 后 ， 我 们 还 要 讲 解 关 于 树 这 一 数据 结构 的 相关 知 
识 ， 可 见 它 的 重要 性 。 


A 


r 


开头 我 们 提 到 了 树 的 定义 ， 讲 到 了 递归 在 树 定 义 中 的 应 用 。 提 到 了 如 
Επ ΡΕ PY ν OCS > GE > AF > FAIR > REE > BRAK 
等 诸多 概念 ， 这 些 都 是 需要 在 理解 的 基础 上 去 记忆 的 。 


我 们 谈 到 了 树 的 存储 结构 时 ， 讲 了 双亲 表示 法 、 孩 子 表示 法 、 孩 子 兄 
第 表示 法 等 不 同 的 存储 结构 。 


并 由 孩子 兄弟 表示 法 引出 了 我 们 这 章 中 最 重要 一 种 树 ， 二 叉 树 。 


二 又 树 每 个 结 点 最 多 两 棵 子 树 ， 有 左右 之 分 。 提 到 了 和 斜 树 ， 满 二 又 
树 、 完 全 二 又 树 等 特殊 二 又 树 的 概念 。 


ο ο αμ ee ge aor ee en 


二 叉 树 的 存储 结构 由 于 其 特殊 性 使 得 既 可 以 用 顺序 存储 结构 又 可 以 用 
链 式 存储 结构 表示 。 


志 历 是 二 又 树 最 重要 的 一 门 学 问 ， 前 序 、 中 序 、 后 序 以 及 层 序 遇 历 都 
是 需要 熟练 掌握 的 知识 。 要 让 目 己 要 学 会 用 计算 机 的 运行 思维 去 模拟 
递归 的 实现 ， 可 以 加 深 我 们 对 递归 的 理解 。 不 过 ， 并 非 二 义 树 人 遍历 就 
一 定 要 用 到 递归 ， 只 不 过 递归 的 实现 比较 优雅 而 已 。 这 点 需要 明确 。 


二 叉 树 的 建立 自然 也 是 可 以 通过 递归 来 实现 。 


研究 中 也 发 现 ， 二 又 链表 有 很 多 滔 费 的 空 指 针 可 以 利用 ， 碍 找 茶 个 结 
点 的 前 碟 和 后 继 为 什么 非 要 每 次 遇 历 才 可 以 得 到 ， 这 束 引 出 了 如 何 构 
ο oe o BERR SUNG ΧΡΗΣΗ ΡΗΤΗ 
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树 、 和 森林 看 似 复杂 ， 其 实 它们 都 可 以 转化 为 简单 的 二 又 树 来 处 理 ， 我 
们 提供 了 树 、 和 森林 与 二 叉 树 的 互相 转换 的 办 法 ， 这 样 束 使 得 面 对 树 和 
森林 的 数据 结构 时 ， 编 码 实现 成 为 了 可 能 。 

最 后 ， 我 们 提 人 到 了 关于 二 文 树 的 一 个 应 用 ， 医 夫 曼 树 和 赫 夫 曼 编 码 ， 
对 于 带 权 路 径 的 二 叉 树 做 了 详尽 地 讲述 ， 让 你 初步 理解 数据 压缩 的 原 
理 ， 并 明日 其 站 如 何 做 到 无 损 编 码 和 无 错 解 码 的 。 


6.14 ”结尾 语 


在 我 们 这 章 开头 ， 我 们 提 到 了 《 阿 凡 达 》 这 部 电影 ， 电 影 中 有 一 个 情 
万 承 是 人 类 用 移 进 的 航空 武 右 和 导弹 人 硬是 将 那 柠 纳 威 人 赖 以 生存 的 区 
天 大 树 给 放 合 了， 让 人 很 古 史 趾 感慨 ， 如 图 6-14-1 所 示 。 这 尽管 讲 的 只 
古 一 个 虚构 的 故事 ， 但 在 现实 社会 中 ， 人 类 为 了 某 种 很 短期 的 利益 ， 
乱 砍 滥 伐 ,毁灭 森林 ， 破 坏 植被 几乎 天 天 都 在 我 们 大 住 的 地 球 上 演 。 


图 6-14-1 


这 样 造成 的 结 采 了 吏 是 冬天 深 寒 、 夏 天 酷热 、 超 强人 台风 、 AFEK ` R 
滚 泥 流 、 无 尽 干 旱 。 我 们 地 球 上 人 类 的 生存 环境 爱 爱 可 和 危 。 


是 的 ， 这 只 是 一 笔 计算 机 课 ， 讲 的 是 无 生命 的 数据 结构 
这 一 章 的 最 后 ， 我 还 是 想 呼 吁 一 下 大 家 。 


人 受伤 时 还 会 流下 钼 水 ， 树 受 念 时 ， 老 天 都 不 会 玉 泣 。 布 望 我们 的 未 
来 不 要 仅 仪 有 钢筋 水 泥 建 造 的 噩 楼 和 大 厦 ， 也 要 有 郁郁 萄 苞 的 森林 和 
草地 ， 我 们 人 类 才 可 能 与 自然 和 谐 共 处 。 爱 护 树木 、 保 护 森 林 ， 让 我 
们 为 生存 的 家 园 能 够 更 加 自然 与 美好 ， 尽 一 份 自己 的 力量 。 


好 了 ， 今 天 课 就 到 这 ， 下 课 。 
第 7 章 图 

启示 

图 : 


Al (Graph) 是 由 顶点 的 有 穷 非 空 集 合 和 顶点 之 间 边 的 集合 组 成 ， 通 常 
表示 为 : G(VE)， 其 中 ，G 表 示 一 个 图 ，V 是 图 G 中 顶点 的 集合 ，E 是 图 
G 中 边 的 集合 。 


71 开场 白 


旅游 几乎 是 每 个 年 轻 人 的 爱好 ， 但 没有 钱 或 没 时 间 也 是 困惑 年 轻 人 不 
能 圆梦 的 直接 原因 。 如 果 可 以 用 最 少 的 资金 和 最 少 的 时 间 周 游 中 国 甚 
至 是 世界 一 定 是 非常 棱 的 。 假 设 你 已 经 有 了 一 笔 不 算 很 丰裕 的 内 钱 ， 
ο προς 。 此 时 打算 全 国 性 的 旅游 ， 你 将 会 如 何 安排 这 次 
行程 呢 ? 


我 们 假设 旅游 融 是 逐个 省 市 进行 ， 省 市 内 的 风景 区 不 去 细 分 ， 例 如 北 
乐 玩 7 天 ， 天 津 玩 3 天 ， 四 川 玩 20 天 这 样子 。 你 现在 需要 做 的 就 是 制订 
一 个 规划 方案 ， 如 何 才 能 用 最 少 的 成 本 将 图 7-1-1 中 的 所 有 省 市 部 玩 
裔 ， 这 里 所 谓 最 少 的 成 本 是 指 交 通 成 本 与 时 间 成 本 。 


如 有 果 你 不 善于 规划 ， 很 有 可 能 就 会 出 现 如 玩 好 新 疆 后 到 海南 ， 然 后 再 
冲 向 黑龙 江 这 样 的 冶 唐 决策 。 但 是 即使 是 紧 挨 着 省 市 游玩 的 方案 也 会 


树 。 但 在 
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图 7-1-1 


你 一 时 解答 不 了 这 些 问 题 是 很 正 党 的， 计算 的 工作 本 来 束 非 人 脑 而 应 
该 是 电脑 去 做 的 事情 。 我 们 今天 要 开始 学 习 最 有 意思 的 一 种 数据 结构 
一 一 图 。 在 图 的 应 用 中 ， 就 有 相应 的 算法 来 解决 这 样 的 问题 。 学 完 这 
πο ο ο κα ον ος 


7.2 图 的 定义 


在 线性 表 中 ， 数 据 元 素 之 间 是 被 串 起 来 的 ， 仅 有 线性 关系， 每 个 数据 
元 素 只 有 一 个 直接 前 张 和 一 个 直接 后 继 。 在 树 形 结构 中 ， 数 据 元 素 之 
间 有 着 明显 的 层次 关系 ， 并 且 每 一 层 上 的 数据 元 素 可 能 和 下 一 层 中 多 
个 元 素 相 关 ， 但 只 能 和 上 一 层 中 一 个 元 素 相关 。 这 和 一 对 父母 可 以 有 
多 个 孩子 ， 但 每 个 孩子 却 只 能 有 一 对 父母 是 一 个 道理 。 可 现实 中 ， 人 
与 人 之 间 关 系 就 非常 复杂 ， 比 如 我 认识 的 朋友 ， 可 能 他 们 之 间 也 互相 
认识 ， 这 就 不 是 简单 的 一 对 一 、 一 对 多 ， 人 研究 人 际 关 系 很 自然 会 考虑 
多 对 多 的 情况 。 那 就 是 我 们 今天 要 研究 的 主题 一 一 图 。 图 是 一 种 较 线 
性 表 和 树 更 加 复 洒 的 数据 结构 。 在 图 形 结构 中 ， 结 点 之 间 的 关系 可 以 
征 任意 的 ， 图 中 任意 两 个 数据 元 素 之 间 都 可 能 相关 。 


前 面 同学 可 能 党 得 树 的 术语 好 多 ， 可 来 到 了 图 ， 你 束 知 道 ， 什 么 才 叫 
做 真正 的 术语 多 。 不 过 术语 再 多 也 是 有 规律 可 拥 的 ， 让 我 们 开 
始 “ 图 ”世界 的 旅程 。 如 图 7-2-1 所 示 ， 先 来 看 定义 。 


图 7-2-1 


Al (Graph) 是 由 顶点 的 有 穷 非 空 集 合 和 顶点 之 间 边 的 集合 组 成 ， 通 常 
表示 为 : G(V,E)， 其 中 ，G 表 示 一 个 图 ，V 是 图 G 中 顶点 的 集合 ，E 古 
G 中 边 的 集合 。 


对 于 图 的 定义 ， 我们 需要 明确 几 个 注意 的 地 方 。 


2 PE Se HP (ΠΑΣ A Wc, Ημ 52455, eA 
中 数据 元 素 ， 我 们 则 称 之 为 顶点 (Vertex) ο 

线性 表 中 可 以 没有 数据 元 素 ， 称 为 空 表 。 树 中 可 以 没有 结 点 ， 叫 
做 空 树 。 那 么 对 于 图 呢 ? 我 记得 有 一 个 笑话 说 一 个 小 朋友 拿 着 一 
张 空 日 纸 给 别人 却说 这 是 他 画 的 一 幅 “ 牛 吃 草 ”的 画 ,“ 那 章 

呢 ?** 草 被 牛 吃 光 了 。”“ 那 牛 呢 ? ”和牛 吃 完 草 束 走 了 呀 。”* 之 所 以 
好 笑 是 因为 我 们 根本 不 认为 一 张 空白 纸 算 作 画 的 。 同 样 ， 在 图 结 
构 中 ， 不 允许 没有 顶点 。 在 定义 中 ， 若 V 是 顶点 的 集合 ， 则 强调 了 
顶点 集合 V 有 穷 非 空 。 

线性 表 中 ， 相 邻 的 数据 元 素 之 间 具 有 线性 关系 ， 树 结构 中 ， 相 邻 
两 层 的 结 点 具有 层次 关系 ， 而 图 中 ， 任 意 两 个 顶点 之 间 都 可 能 
关系 ， 顶 点 之 间 的 逻辑 关系 用 边 来 表示 ， 边 集 可 以 是 空 的 。 


7.2.1 各 种 图 定义 


FCA: 奉 顶 操 Vi 到 vj 之 间 的 边 没有 方 同 ， 则 称 这 条 边 为 无 癌 边 
(Edge) ， 用 无 序 偶 对 (vi,vj) 来 表示 。 如 果 图 中 任意 两 个 顶点 之 间 的 
边 都 是 无 向 边 ， 则 称 该 图 为 无 向 图 (Undirected graphs) 。 图 7-2-2 就 是 
一 个 无 向 图 ， 由 于 是 无 方 回 的 ， 连 接 顶 点 A 与 D 的 边 ， 可 以 表示 成 无 序 
对 (A,D)， 也 可 以 写成 (D,A)。 


对 于 图 7-2-2 中 的 无 向 图 G ; 来 说 ，G j=(V i ,{E1)， 其 中 顶点 集合 V j= 
{A,B,C,D}; 边 集合 E; ={(A,B),(B,C),(C,D),(D,A),(A,C)} 


图 7-2-2 


Al: 若 从 顶点 vi 到 vj 的 边 有 方向 ， 则 称 这 条 边 为 有 向 边 ， 也 称 为 

J (Arc) 。 用 有 序 偶 <vi,v ;> 来 表示 ,vi; 称 为 弧 尾 (Tail) , vi PRATT 

头 (Head) 。 如 果 图 中 任意 两 个 顶点 之 间 的 边 都 是 有 向 边 ， 则 称 该 图 

为 有 向 图 (Directed graphs) 。 图 7-2-3 就 是 一 个 有 向 图 。 连 接 顶 点 A 到 

ο. "ου A 是 弧 尾 ，D 是 弧 头 ，<A,D> 表 示 弧 ， 注 意 不 能 写 
<D,A> 。 


图 7-2-3 


对 于 图 7-2-3 中 的 有 向 图 G ,来 说 ，G， =(V，,{E>， 其 中 顶点 集合 V，= 
{A,B,C,D}; 弧 集合 E ,={<A,D>,<B,A>,<C,A>,<B,C>}。 


ἘΤΒΕ 了， 无 辣 边 用 小 括号 “()”* 表 示 ， 而 有 问 边 则 是 用 尖 插 号 “<>” 表 


αλ 
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这 样 的 图 为 简单 图 。 我 们 课程 里 要 讨论 的 都 是 简单 图 。 显 然 图 7-2-4 中 
的 两 个 图 束 不 属于 我 们 要 讨论 的 施 围 。 


图 7-2-4 


在 无 向 图 中 ， 如 果 任 意 两 个 顶点 之 间 都 存在 边 ， 则 称 该 图 为 无 向 完全 
图 。 含 有 n 个 顶点 的 无 向 完全 图 有 n(n-1)/2 条 边 。 比 如 图 7-2-5 就 是 无 向 
完全 图 ， 因 为 每 个 顶点 都 要 与 除 它 以 外 的 顶点 连 线 ， 顶 点 A 与 BCD 三 个 
顶点 连 线 ， 共 有 四 个 顶点 ， 自 然 是 4x*3， 但 由 于 顶点 A 与 顶点 B 连 线 
后 ， 计 算 B 与 A 连 线 就 是 重复 ， 因 此 要 整体 除 以 2， 共 有 6 条 边 。 


AK 


a2 


在 有 回 图 中 ， 如 果 任 意 两 个 顶点 之 间 都 存在 方向 互 为 相反 的 两 条 弧 ， 
ο 全 有 n 个 顶点 的 有 回 完 全 图 有 nx(n-1) 条 边 ， 如 
色 7-2-6 所 示 。 


图 7-2-6 


从 这 里 也 可 以 得 到 结论 ， 对 于 具有 n 个 顶点 和 e 条 边 数 的 图 ， 无 向 图 
0<e<n(n-1)/2， 有 癌 图 0<e<n(n-1)。 
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征 模 糊 的 概念 ， 都 是 相对 而 言 的 。 比 如 我 去 上 海 世博 会 那天 ， 参 观 的 
人 数 关 不 多 50 万 人 ， 我 个 人 感觉 人 数 实在 是 太 多 ， 可 以 用 稠密 来 形 

容 。 可 后 来 听 说 ， 世 博 园 里 人 数 最 多 的 一 天 达到 了 103 万 人 ， 啊 ，50 万 
EEA λε θυ} 5 


有 些 图 的 边 或 弧 具 有 与 它 相 关 的 数 子 ， 这 种 与 图 的 边 或 弧 相 关 的 数 叫 
做 权 (Weight) 。 这 些 权 可 以 表示 从 一 个 顶点 到 男 一 个 顶点 的 距离 或 耗 
费 。 这 种 带 权 的 图 通常 称 为 网 (Network) 。 图 7-2-7 就 是 一 张 带 权 的 
图 ， 即 标识 中 国 四 大 城市 的 直线 距离 的 网 ， 此 图 中 的 权 束 是 两 地 的 距 
的 ο 


图 7-2-7 


假设 有 两 个 图 G=(V,{ED 和 G'=(V',{E'})， 如 果 V'V 且 EE， 则 称 G' 为 G 的 
pa τ ο PUN A7-2-87F RAN AISA Msc a ASA [5] [8] 
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图 7-2-8 


7.2.2 ”图 的 顶点 与 边 间 关 系 


对 于 无 向 图 G=(V,{E})， 如 果 边 (v,v)EE， 则 称 顶点 v 和 vV' 互 为 邻接 点 
(Adjacent) ， 即 v 和 vw 相 邻接 。 边 (vv 依附 (incident) 于 顶点 v 和 v'， 
或 者 说 (vv') 与 顶点 v 和 v' 相 关联 。 顶 点 v 的 度 (Degree) 是 和 v 相 关联 的 


边 的 数目 ， 记 为 TD(v)。 例 如 图 7-2-8 左 侧 上 方 的 无 向 图 ， 顶 点 A 与 B 互 
为 邻接 点 ， 边 (A,B) 依 附 于 顶点 A 与 B 上 ， 顶 点 A 的 度 为 3。 而 此 图 的 边 
数 是 5， 各 个 顶点 度 的 和 =3+2+3+2=10， 推 项 后 发 现 ， 边 数 其 实 就 是 各 
顶点 度数 和 的 一 半 ， 多 出 的 一 半 是 因为 重复 两 次 记 数 。 简 记 之 ，。 


对 于 有 向 图 G=(V,{E}))， 如 果 弧 <v,v>EE， 则 称 顶 点 v 邻 接 到 顶点 v'， 顶 
点 v' 邻 接 自 顶 点 v。 弧 <v,v> 和 顶点 v，v' 相 关联 。 以 顶点 v 为 头 的 弧 的 数 
目 称 为 v 的 入 度 (InDegree) ， 记 为 ID(v);， 以 Vv 为 尾 的 弧 的 数目 称 为 v 的 
出 度 (OutDegree) ， 记 为 OD(v); 顶点 v 的 度 为 TD(v)=ID(v)+OD(vV)。 
例如 图 7-2-8 左 侧 下 方 的 有 了 癌 图 ， 顶 点 A 的 入 度 是 2 (从 B 到 A 的 弧 ， 从 C 
到 A 的 弧 ) ， 出 度 是 1 (从 A 到 D 的 弧 ) ， 所 以 顶点 A 的 度 为 2+1=3。 此 
有 问 图 的 弧 有 4 条 ， 而 各 顶点 的 出 度 和 =1+2+1+0=4， 各 顶点 的 入 度 和 
=2+0+1+1=4。 所 以 得 到 e=sigma(i=1, n, ID(v ; =sigma(i=1, n, OD(v |) ° 


无 向 图 G=(V,{E}) 中 从 顶点 v 到 顶点 v' 的 路 径 (Path) 是 一 个 顶点 序列 
(v=v ;,0,v,,1,....V; παν’), 其 中 (Vv; ,j-1,v; 1 )ΕΕ, 1<j<m。 例 如 图 7-2-9 中 
束 列 举 了 顶点 B 到 顶点 DD 四 种 不 同 的 路 径 。 
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图 7-2-9 


如 果 G 是 有 癌 图 ， 则 路 径 也 是 有 癌 的 ， 顶 点 序列 应 满足 <v i j-1,v; 
,>EE，1<j<m。 例 如 图 7-2-10， 顶 点 B 到 DD 有 两 种 路 径 。 而 顶点 A 到 B， 
就 不 存在 路 径 。 


图 7-2-10 


树 中 根 结 点 到 任意 结 点 的 路 径 是 唯一 的 ， 但 是 图 中 顶点 与 顶点 之 间 的 
路 径 却 是 不 唯一 的 。 


路 径 的 长 度 是 路 径 上 的 边 或 弧 的 数目 。 图 7-2-9 中 的 上 方 两 条 路 径 长 度 
ας 下方 两 条 路 径 长 度 为 3。 图 7-2-10 左 侧 路 径 长 为 2， 右 侧 路 径 长 度 
站 3 ὁ 


第 一 个 顶点 和 最 后 一 个 顶点 相同 的 路 径 称 为 回路 或 环 (Cycle) ο 序列 
中 顶 总 不 重复 出 现 的 路 径 称 为 简单 路 径 。 除 了 第 一 个 顶点 和 最 后 一 个 
顶点 之 外 ， 其 余 顶 点 不 重复 出 现 的 回路 ， 称 为 简单 回路 或 商 单 环 。 图 7- 


2-11 中 两 个 图 的 粗 线 部 构成 环 ， 左 侧 的 环 因 第 一 个 顶点 和 最 后 一 个 顶 所 
都 是 B， 且 C、D、A 没 有 重复 出 现 ， 因 此 是 一 个 商 单 环 。 而 右 侧 的 环 ， 
由 于 顶 扩 C 的 重复 ， 它 就 不 古人 简单 环 了 。 


图 7-2-11 
7.2.3 ”连通 图 相关 术语 


在 无 同 图 G 中 ， 如 果 从 顶点 v 到 顶点 Vv 有 路 人 径 ， 则 称 v 和 v' 是 连通 的 。 如 
果 对 于 图 中 任意 两 个 顶点 vi;、v; EV，v; 和 v ;都 是 连通 的 ， 则 称 G 是 连 
通 图 (Connected Graph) 。 图 7-2-12 的 图 1， 它 的 顶点 A 到 顶点 B、C、 
D 都 是 连通 的 ， 但 显然 顶点 A 与 顶点 E 或 F 就 无 路 人 径 ， 因 此 不 能 算是 连通 
ο 而 图 7-2-12 的 图 2， 顶 点 A、B、C、D 相 互 都 是 连通 的 ， 所 以 它 本 
吴 是 连通 图 。 


4) 
图 7-2-12 
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Wal: 


。 RETK; 
。 了 于 图 要 是 连通 的 ; 
。 连通 子 图 含有 极 大 顶点 数 ; 
。 具有 极 大 顶点 数 的 连通 子 图 包含 依附 于 这 些 顶 点 的 所 有 边 。 
图 7-2-12 的 图 1 是 一 个 无 癌 非 连通 图 。 但 是 它 有 两 个 连通 分 量 ， 即 图 2 和 


图 3。 而 图 4， 尽 管 是 图 1 的 于 图 ， 但 是 它 却 不 满足 连通 子 图 的 极 大 顶点 
数 (图 2 满足 。 因 此 它 不 是 图 1 的 无 向 图 的 连通 分 量 。 


在 有 问 图 G 中 ， 如 琳 对 于 每 一 对 v;、v; EV、vizV; ， 从 Vi 到 v; 和 从 vj 

Elly, 都 存在 路 径 ， 则 称 ‘:G 是 强 连 通 图 。 有 向 图 中 的 极 大 强 连 通 子 图 称 做 
有 向 图 的 强 连通 分 量 。 例 如 图 7-2-13， 图 1 并 不 是 强 连 通 图 ， 因 为 顶点 

A 到 顶点 DD 存在 路 径 ， 而 Da 到 A 就 不 存在 。 图 2 就 是 强 连通 图 ， 而 且 显 然 
图 2 是 图 1 的 极 大 强 连通 子 图 ， 即 是 它 的 强 连通 分 量 。 
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现在 我 们 再 来 看 连通 图 的 生成 树 定义 。 
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的 n 个 顶点 ， 但 只 有 足以 构成 一 棵 树 的 n-1 条 边 。 比 如 图 7-2-14 的 图 1 是 
一 普通 图 但 显然 它 不 是 生成 村 ， 当 去 掉 两 条 构成 环 的 边 后 ， 比 如 图 2 
或 图 3， 束 满足 n 个 顶点 n-1 条 边 且 连通 的 定义 了 。 它 们 都 是 一 棵 生成 

树 。 从 这 里 也 可 知道 ， 如 果 一 个 图 有 n 个 顶点 和 小 于 n-1 条 边 ， 则 是 非 连 
通 图 ， 如 果 它 多 于 n-1 边 条 ， 必 定 构成 一 个 环 ， 因 为 这 条 边 使 得 它 依附 
的 那 两 个 顶点 之 间 有 了 第 二 条 路 径 。 比 如 图 2 和 图 3， 随 便 加 哪 两 顶点 
的 边 都 将 构成 环 。 不 过 有 n-1 条 边 并 不 一 定 是 生成 树 ， 比 如 图 4。 
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图 


ΕΙ 


图 7-2-14 


如 果 一 个 有 向 图 恰 有 一 个 顶点 的 入 度 为 0， 其 余 顶 点 的 入 上 度 均 为 1， 则 
征 一 个 有 向 树 。 对 有 回 树 的 理解 比较 容易 ， 所 谓 入 度 为 0 其 实 就 相当 于 
树 中 的 根 结 点 ， 其 余 顶 点 入 度 为 1 就是 说 树 的 非 根 结 点 的 双亲 只 有 一 

个 。 一 个 有 疝 图 的 生成 森林 由 铬 干 棵 有 向 树 组 成 ， 含 有 图 中 全 部 顶 

上 护 ， 但 只 有 足以 构成 耕 干 棵 不 相交 的 有 同 树 的 弧 。 如 图 7-2-15 的 图 1 是 
一 哥 有 疝 图 。 去 挥 一 些 弧 后 ， 它 可 以 分 解 为 两 柠 有 疝 树 ， 如 图 2 和 图 

3， 这 两 棵 就 是 图 1 有 向 图 的 生成 森林。 
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图 7-2-15 

7.2.4 图 的 定义 与 术语 总 结 

术语 终于 介绍 得 差不多 了 ， 可 能 有 不 少 同 学 有 些 头 晤 ， 我 们 再 来 整理 
一 下 。 


图 按照 有 无 方 同 分 为 无 癌 图 和 有 问 图 。 无 辣 图 由 顶点 和 边 构 成 ， 有 癌 
图 由 顶点 和 弧 构 成 。 弧 有 弧 尾 和 弧 头 之 分 。 
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边 则 叫价 单 图 。 


图 中 顶点 之 间 有 邻接 点 、 依 附 的 概念 。 无 向 图 顶点 的 边 数 叫做 度 ， 有 
癌 图 顶点 分 为 入 度 和 出 度 。 


独 上 的 和 边 或 弧 上 市 权 则 称 为 网 。 


图 中 顶点 间 存 在 路 径 ， 两 顶点 存在 路 径 则 说 明 坪 连通 的 ， 如 采 路 径 最 
终 回 到 起 始点 则 称 为 环 ， 当 中 不 重复 叫 简单 路 径 。 大 任意 两 顶点 都 是 
TBA, ΠΙΕΗΒΕΧΕΧΕΙΒΑΙ, BRA A PATA, AFR 
PGMS eas ΞΕ, AAP oe 9 


无 问 图 中 连通 且 n 个 顶点 n-1 条 边 叫 生成 树 。 有 回 图 中 一 顶点 入 度 为 0 其 
ο ο μμ 


73 图 的 抽象 数据 类 型 
图 作为 一 种 数据 结构 ， 它 的 抽象 数据 类 型 带 有 目 己 特点 ， 正 因为 它 的 


复 淋 ， 运 用 广泛 ， 使 得 不 同 的 应 用 需要 不 同 的 运 滤 集合 ， 构 成 不 同 的 
抽象 数据 操作 。 我 们 这 里 就 来 看 看 图 的 基本 操作 。 


ADT 图 (Graph) 


Data 


顶点 的 有 穷 非 空 集 合 和 边 的 集合 。 


Operation 
CreateGraph(*G, V, VR): 按照 顶点 集 V 和 边 弧 集 VR 的 定义 构造 图 6。 
DestroyGraph(*6): 图 G 存 在 则 销毁 。 
LocateVex(G, u): 车 图 6 中 存在 顶点 u， 则 返回 图 中 的 位 置 。 
GetVex(G, v): 返回 图 6 中 顶点 v 的 值 。 
PutVex(G, v, value): 将 图 6 中 顶点 v 赋 值 value。 
FirstAdjVex(G, *v): 返回 顶点 v 的 一 个 邻接 顶点 ， 若 顶点 在 6 中 无 邻接 顶点 返回 空 。 
NextAdjVex(G，v，*w): ”返回 顶点 v 相 对 于 顶点 w 的 下 一 个 邻接 顶点 ， 


若 w 是 v 的 最 后 一 个 邻接 点 则 返回 “ 空 
InsertVex(*G, v): 在 图 6 中 增添 新 顶点 v。 
DeleteVex(*G, v): 删除 图 6 中 顶点 v 及 其 相关 的 弧 。 


在 图 6 中 增添 弧 <v, w>， 若 6 是 无 向 图 ， 还 需要 增添 对 称 弧 <w, ν» 5 
在 图 6 中 删除 弧 <v,w>， 若 6 是 无 向 图 ， 则 还 删除 对 称 弧 <w, v> ° 


InsertArc(*G, v, w): 


DeleteArc(*G, v, w): 


DFSTraverse(G): 对 图 G 中 进行 深度 优先 遍历 ， 在 遍历 过 程 对 每 个 顶点 调 
HFSTraverse(G) : 对 图 G 中 进行 广度 优先 遍历 ， 在 遍历 过 程 对 每 个 顶点 调 
endADT 


7.4 图 的 存储 结构 


图 的 存储 结构 相 较 线性 表 与 树 来 说 束 更 加 复 洒 了 。 首 完 ， 我 们 口头 上 
说 的 “顶点 的 位 置 ” 或 “邻接 点 的 位 置 ”" 只 是 一 个 相对 的 概念 。 其 实 从 图 的 
逻辑 结构 定义 来 看 ， 图 上 任何 一 个 顶点 都 可 被 看 成 古 第 一 个 项 护 ， 任 
一 顶点 的 邻接 点 之 间 也 不 存在 次 序 关 系 。 比 如 图 7-4-1 中 的 四 张 图 ， 仔 
细 观 察 发 现 ， 它 们 其 实 是 同一 个 岁 ， 只 不 过 顶点 的 位 置 不 同 ， 束 造成 
了 表象 上 不 太一 样 的 感觉 。 


图 7-4-1 


也 正 由 于 图 的 结构 比较 复杂 ， 任 意 两 个 顶点 之 间 都 可 能 存在 联系 ， 因 
此 无 法 以 数据 元 素 在 内 存 中 的 物理 位 置 来 表示 元 素 之 间 的 关系 ， 也 就 
是 说 ， 图 不 可 能 用 简单 的 顺序 存储 结构 来 表示 。 而 多 重 链表 的 方式 ， 
即 以 一 个 数据 域 和 多 个 指针 域 组 成 的 结 点 表示 图 中 的 一 个 项 点， 尽管 
可 以 实现 图 结构 ， 但 其 实在 树 中 ， 我 们 也 已 经 讨论 过 ， 这 是 有 问题 
的 。 如 果 各 个 顶点 的 度数 相差 很 大 ， 按 度数 最 大 的 顶点 设计 结 点 结构 
会 造成 很 多 存储 单元 的 浪费 ， 而 若 按 每 个 顶点 自己 的 度数 设计 不 同 的 
顶点 结构 ， 又 融 来 操作 的 不 便 。 因 此 ， 对 于 图 来 说 ， 如 何 对 它 实现 物 
理 存 储 是 个 难题 ， 不 过 我 们 的 前 辈 们 已 经 解决 了 ， 现 在 我 们 来 看 前 辈 
们 提供 的 五 种 不 同 的 存储 结构 ο 

7.4.1 SPERE 

考虑 到 图 是 由 顶点 和 边 或 弧 两 部 分 组 成 。 合 在 一 起 比较 困难 ， 那 惑 很 
目 然 地 考虑 到 分 两 个 结构 来 分 别 存储 。 顶 点 不 分 大 小 、 主 次 ， 所 以 用 
一 个 一 维 数组 来 存储 是 很 不 错 的 选择 。 而 边 或 弧 由 于 是 顶点 与 项 点 之 
间 的 关系 ， 一 维 搞 不 定 ， 那 就 考虑 用 一 个 二 维 数组 来 存储 。 于 是 我 们 
的 邻接 和 矩阵 的 方案 就 诞生 了 。 

图 的 邻接 矩阵 (adjacency Matrix) 存储 方式 是 用 两 个 数组 来 表示 图 。 
一 个 一 维 数组 存储 图 中 顶点 信息 ， 一 个 二 维 数组 〈 称 为 邻接 矩阵 ) 存 
储 图 中 的 边 或 弧 的 信息 。 


设 图 G 有 n 个 顶点 ， 则 邻接 矩阵 是 一 个 nxn 的 方 阵 ， 定 义 为 : 
二 \ 
LEl, )E ER <v, >EE 
\ 
RZ 


我 们 来 看 一 个 实例 ， 图 7-4-2 的 左 图 就 是 一 个 无 向 图 。 


πι, 


FANA. 


ἘΜ 


图 7-4-2 


我 们 可 以 设置 两 个 数组 ， 顶 点 数组 为 ver-tex[4]={fvovivvv3}+， 边 数 
组 arc[4][4] 为 图 7-4-2 右 图 这 样 的 一 个 矩阵 。 人 简单 解释 一 下 ， 对 于 矩阵 的 
主 对 角 线 的 值 ， 即 arc[0][0]、arc[1][1]、arc[2][2]、arc[3][3]， 全 为 0 是 因 
为 不 存在 顶点 到 目 匡 的 边 ， 比 如 v0 到 vo 。arc[0][1]=1 是 因为 vo 到 vj 的 
边 存在 ， 而 arc[1][3]=0 是 因为 v; 到 v ;的 边 不 存在 。 并 且 由 于 是 无 癌 
Εἰ, νι lv, 的 边 不 存在 ， 意 味 着 v ,到 v | 的 边 也 不 存在 。 所 以 无 向 图 
的 边 数 组 是 一 个 对 称 和 矩阵 。 

ΠΕΡ 对 称 和 矩阵 是 什么 ? Rid SABA, 复习 一 下 。 所 谓 对 称 和 矩阵 束 是 n 
阶 矩 阵 的 元 满足 aij =aji (Osi,jsn) 。 即 从 矩阵 的 左上 角 到 右 下 角 的 
主 对 角 线 为 轴 ， 右 上 和 角 的 元 与 左下 角 相 对 应 的 元 全 都 是 相等 的 。 


A TANER, KID DURA SD A ΕΗ aa 5 
1. 我 们 要 判定 任意 两 顶点 是 否 有 边 无 边 就 非常 容易 了 。 


2. 我 们 要 知道 某 个 顶点 的 度 ， 其 实 束 是 这 个 顶点 vi; 在 邻接 矩阵 中 第 ; 行 
(或 第 i 列 ) 的 元 素 之 和 。 比 如 顶点 v1 的 度 就 是 1+0+1+0=2 。 


3. 求 顶点 vi 的 所 有 邻接 点 束 是 将 矩 孟 中 人 第 i 行 元 素 扫 摘 一 过 ，arc[i[] 为 1 
hae BREE ° 


我 们 再 来 看 一 个 有 癌 图 样 例 ， 如 图 7-4-3 所 示 的 左 图 。 


μα. 加 加 


q vo ite 


EEEN 


VI 的 入 度 为 | 


图 7-4-3 


顶点 数组 为 vertex[4]={v0,v1,v2,vV3}， 弧 数组 arc[4][4] 为 图 7-4-3 右 图 这 样 
的 一 个 和 矩阵。 主 对 角 线 上 数值 依然 为 0°。 但 因为 是 有 问 图 ， 所 以 此 和 矩阵 
并 不 对 称 ， 比 如 由 vi; 到 v0 有 弧 ， 得 到 arc[1][0]=1， 而 vo Flv, AM, 
因此 arc[0][1]=0。 


有 了 向 图 讲究 入 度 与 出 度 ， 顶 点 v1 的 入 度 为 1， 正 好 是 第 v1 列 各 数 之 
和 。 顶 点 v1 的 出 度 为 2， 即 第 v | 行 的 各 数 之 和 。 


与 无 向 图 同样 的 办 法 ， 判 断 顶点 vi; 到 v 是否 存在 弧 ， 只 需要 查找 矩阵 
Parclilij]ae a A 16H AY 5 Beky | AAT Be ie AEE RTT ICT 
描 一 志 ， 查 找 arc[i][j] 为 1 的 顶点 。 


在 图 的 术语 中 ， 我 们 提 到 了 网 的 概念 ， 也 就 是 每 条 边 上 带 有 权 的 图 叫 
做 网 。 那 么 这 些 权 值 就 需要 存 下 来 ， 如 何 处 理 这 个 矩阵 来 适应 这 个 需 
RUE? 我 们 有 办 法 。 


设 图 G 古 网 图 ， 有 n 个 项 不， 则 邻接 答 阵 是 一 个 nxn 的 方 阵 ， 定 义 为 : 


这 里 w ij 表示 (ViVj ) 或 <VivVj > 上 的 权 值 © oo 表示 个 计算 机 允许 

的 、 大 于 所 有 边 上 权 值 的 值 ， 也 束 是 一 个 不 可 能 的 极限 值 。 有 同学 会 

问 ， 为 什么 不 是 0 呢 ? 原因 在 于 权 值 wij 大 多 数 情况 下 是 正 值 ， 但 个 别 

时 候 可 能 惑 是， 甚至 有 可 能 是 负 值 。 因 此 必须 要 用 一 个 不 可 能 的 值 来 
。 如 图 7-4-4 堪 图 驳 是 一 个 有 回 网 图 ， 右 图 驶 是 它 的 邻接 矩 


κο 
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图 7-4-4 


那么 邻接 矩阵 是 如 何 实现 图 的 创建 的 呢 ? 我 们 先 来 看 看 图 的 邻接 矩阵 
存储 的 结构 ， 代 码 如 下 。 


/* 顶点 类 型 应 ENE 


typedef char VertexType; 


/* 边 上 的 权 值 类 型 应 户 定 义 */ 


typedef int EdgeType; 


/* 最 大 顶点 数 ， 应 4 


#define MAXVEX 100 


Vx 


65535 来 代表 o */ 


#define INFINITY 65535 


typedef struct 


{ 


/* 顶点 表 */ 


VertexType vexs[MAXVEX]; 


/* 邻接 矩阵 ， 可 看 作 边 表 */ 


EdgeType arc[MAXVEX] [MAXVEX]; 


T= 


图 中 当前 的 顶点 数 和 边 数 */ 


int numVertexes, numEdges; 


} MGraph; 


有 了 这 个 结构 定义 ， 我 们 构造 一 个 图 ， 其 实 束 是 
数据 的 过 程 。 我 们 来 看 看 无 向 网 图 的 创建 代码 。 


/* 建立 无 向 网 图 的 邻接 矩阵 表示 */ 


void CreateMGraph(MGraph *G) 


{ 


ΠΠ ale al, ola 1η 


printf(" 输 入 顶点 数 和 边 数 :\n"); 


Vis 


scanf("%d,%d", &G->numVertexes, &G->numEdges) ; 


Ex 


for (i = 0; i < G->numVertexes; i++) 


for (i = 0; i < G->numVertexes; i++) 


Ws 


for (k = 0; k < G->numEdges; k++) 


输入 顶点 数 和 边 数 */ 


读 入 顶点 信息 ， 建 立 顶点 表 */ 


scanf (&G->vexs[i]); 


for (j = 0; j <G->numVertexes; j++) 


/* 邻接 和 矩阵 初始 化 */ 


G->arc[i][j] = INFI 


NITY; 


E 阵 */ 


读 入 numEdges 条 边 ， 建 立 邻 接 久 


Αν 
给 


Ti 


扩 表 和 边 表 输入 


printf(" 输 入 边 (vi,vj) 上 的 下 标 i， 下 标 j] 和 权 w:\n"); 
/* 输入 边 (vi,vj) 上 的 权 w */ 
scanf("%d,%d,%d", &i, &j, &w); 


G->arc[i][j] = w; 


/* 因为 是 无 向 图 ， 甜 阵 对 称 */ 


G->arc[j][i] = G->arc[i][j]; 
} 


从 代码 中 也 可 以 得 到 ，n 个 顶点 和 e 条 边 的 无 向 网 图 的 创建 ， 时 间 复 杂 
度 为 O(nt+n*+e)， 其 中 对 邻接 矩阵 G.arc 的 初始 化 耗费 了 O(n?) 的 时 间 。 


7.4.2 ”邻接 表 


邻接 矩阵 是 不 错 的 一 种 图 存储 结构 ， 但 是 我 们 也 发 现 ， 对 于 边 数 相对 
顶点 较 少 的 图 ， 这 种 结构 是 存在 对 存储 空间 的 极 大 浪费 的 。 比 如 说 ， 
如 琳 我 们 要 处 理 图 7-4-5 这 样 的 稀 玖 有 癌 图 ， 邻 授 答 阵 中 除了 arc[1]J[0] 有 
权 值 外 ， 没 有 其 他 弧 ， 其 实 这 些 存 储 空间 都 浪费 掉 了 。 


顶 妆 组 
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四 0 oe 
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图 7-4-5 


因此 我 们 考虑 另外 一 种 存储 结构 方式 。 回 忆 我 们 在 线性 表 时 谈 到 ， 顺 
序 存储 结构 就 存在 预先 分 配 内 存 可 能 造成 存储 空间 少 费 的 问题 ， 于 是 
引出 了 链 式 存储 的 结构 。 同 样 的 ， 我 们 也 可 以 考虑 对 边 或 弧 使 用 链 式 
存储 的 方式 来 避免 空间 浪费 的 问题 。 


再 回忆 我 们 在 树 中 谈 存 储 结构 时 ， 讲 到 了 一 种 孩子 表示 法 ， 将 结 点 存 
入 数组 ， 并 对 结 点 的 孩子 进行 链 式 存储 ， 不 管 有 多 少 孩 子 ， 也 不 会 存 
在 空间 浪费 问题 。 这 个 思路 同样 适用 于 图 的 存储 。 我 们 把 这 种 数组 与 
链表 相 结 合 的 存储 方法 称 为 邻接 表 (Ad-jacency List) 。 


邻接 表 的 处 理 办 法 是 这 样 。 


1. 图 中 顶点 用 一 个 一 维 数 组 存储 ， 当 然 ， 顶 点 也 可 以 用 单 链表 来 存储 ， 
不 过 数组 可 以 较 容 易 地 读 取 顶点 信息 ， 更 加 方便 。 另 外 ， 对 于 顶点 数 
组 中 ， 每 个 数据 元 素 还 需要 存储 指向 第 一 个 邻接 点 的 指针 ， 以 便于 查 
找 该 项 点 的 边 信息 。 


2. 图 中 每 个 顶 感 vj; 的 所 有 邻接 点 构成 一 个 线性 表 ， 由 于 邻接 点 的 个 数 不 
re, POA RR ia, ICRA ATA se, ARIAT 
点 vi 作为 弧 尾 的 出 边 表 。 


例如 图 7-4-6 所 示 的 束 古 一 个 无 癌 图 的 邻 授 表 结 构 。 


Mir data firstedge adjvex next 


图 7-4-6 


从 图 中 我 们 知道 ， 顶 点 表 的 各 个 结 点 由 data 和 firstedge 两 个 域 表 示 ，data 
是 数据 域 ， 存 储 顶 点 的 信息 ，firstedge 是 指针 域 ， 指 向 边 表 的 第 一 个 结 
点 ， 即 此 顶点 的 第 一 个 邻接 点 。 边 表 结 点 由 adjvex 和 next 两 个 域 组 成 。 
adjvex 是 邻接 点 域 ， 存 储 某 顶点 的 邻接 点 在 顶点 表 中 的 下 标 ，next 则 存 
储 指 同 边 表 中 下 一 个 结 点 的 指针 。 比 如 vj 顶点 与 Yo、V5 互 为 邻接 点 ， 
则 在 v1 的 边 表 中 ，adjvex 分 别 为 vo 的 0 和 v ,的 2。 


这 样 的 结构 ， 对 于 我 们 要 获得 图 的 相关 信息 也 是 很 方便 的 。 比 如 我 们 
要 想 知 道 某 个 顶点 的 度 ， 束 去 查找 这 个 顶点 的 边 表 中 结 点 的 个 数 。 寿 


EEG 


要 判断 顶点 vi 到 vj 是 否 存在 边 ， 只 需要 测试 顶点 vi 的 边 表 中 adqjvex 是 
EME TEA A; 的 下 标 j 束 行 了 。 寿 求 顶 点 的 所 有 邻接 点 ， 其 实 吏 是 对 此 
顶点 的 边 表 进行 遍历 ， 得 到 的 adjvex 域 对 应 的 顶点 就 是 邻接 点 。 


若是 有 癌 图 ， 令 接 表 结构 是 类 似 的， 比如 图 7-4-7 中 第 一 幅 图 的 邻接 表 
就 是 第 二 幅 图 。 但 要 注意 的 是 有 癌 图 由 于 有 方 同 ， 我 们 是 以 顶点 为 弧 
尾 来 存储 边 表 的 ， 这 样 很 容易 就 可 以 得 到 每 个 顶点 的 出 度 。 但 也 有 了 时 
为 了 便于 确定 顶点 的 入 度 或 以 顶点 为 弧 头 的 弧 ， 我 们 可 以 建立 一 个 有 
向 图 的 逆 邻 接 表 ， 即 对 每 个 顶点 v ;都 建立 一 个 链接 为 v ;为 弧 头 的 表 。 
如 图 7-4-7 的 第 三 幅 图 所 示 。 


下 标 data firstedge adjvex next 


邻接 表 


下 标 data firstedge adjvex next 


图 7-4-7 


此 时 我 们 很 容易 就 可 以 滤 出 某 个 顶点 的 入 度 或 出 度 是 多 少 ， 判 断 两 顶 
点 是 否 存在 弧 也 很 容易 实现 。 


对 于 市 权 值 的 网 图 ， 可 以 在 边 表 结 点 定义 中 再 增加 一 个 weight 的 数据 
域 ， 存 储 权 值 信息 即 可 ， 如 图 7-4-8 所 示 。 


FF data firstedge adjvex weight next 


图 7-4-8 
有 了 这 些 结构 的 图 ， 下 面 关 于 结 点 定义 的 代码 就 很 好 理解 了 。 


/* 顶点 类 型 应 由 用 户 定 义 */ 


typedef char VertexType; 


/* 边 上 的 权 值 类 型 及 


παλ ή 


长 


typedef int EdgeType; 


eae 


typedef struct EdgeNode 


/* 邻接 点 域 ， 存 储 该 顶点 对 应 的 下 标 */ 


int adjvex; 


/* 用 于 存储 权 值 ， 对 于 非 网 图 可 以 不 需要 */ 
EdgeType weight; 

/* 链 域 ， 指 向 下 一 个 邻接 点 */ 

struct EdgeNode *next; 


} EdgeNode; 


/* TAR */ 
typedef struct VertexNode 


{ 


/* 顶点 域 ， 存 储 顶点 信息 */ 


VertexType data; 


/* 边 表 头 指针 */ 

EdgeNode *firstedge; 
} VertexNode, AdjList [MAXVEX]; 
typedef struct 


{ 


AdjList adjList; 


/* 图 中 当前 顶点 数 和 边 数 */ 


int numVertexes, numEdges; 


} GraphAdjList; 


ο ο 也 就 是 顺理成章 之 事 。 无 向 图 的 邻接 表 创 建 代码 
Η ο 


/* 建立 图 的 邻接 表 结构 */ 


void CreateALGraph(GraphAdjList 36) 


ξ 


alin “aks, ghee 


EdgeNode *e; 
printf(" 输 入 顶点 数 和 边 数 :\n"); 

/* 输入 顶点 数 和 边 数 */ 
scanf("%d,%d", &G->numVertexes, 


&G->numEdges) ; 


/* 读 入 顶点 信息 ， 建 立项 点 对 


ar 


for (i = 0; i < G->numVertexes; i++) 


{ 


/* 输入 顶点 信息 */ 


scanf(&6->adjList[i].data); 


/* 将 边 表 置 为 空 表 */ 


G->adjList[i].firstedge = NULL; 
} 


ο 


yt 


for (k = 0; k < G->numEdges; k++) 

{ 
printf ("Ai (vi, vj) LAS s\n"); 
/* 输入 边 (vi, vj) 上 的 顶点 序号 */ 


seanft( ο ας, 81, R) 


/* 向 内 存 申请 空间 ， */ 


/* 生成 边 表 结 点 “7 

e = (EdgeNode *)malloc(sizeof(EdgeNode) ); 
{9 BERGA */ 

e->adjvex = j; 


/* 将 e 指 针 指向 当前 顶点 指向 的 结 点 */ 


e->next = G->adjList[i].firstedge; 


/* 将 当前 顶点 的 指针 指向 e */ 


G->adjList[i].firstedge = e; 


/* 向 内 存 申请 空间 ， */ 


/* 生成 边 表 结 点 “/ 


e = (EdgeNode *)malloc(sizeof(EdgeNode)); 


ο ο... 
e->adjvex = i; 


/* 将 e 指 针 指向 当前 顶点 指向 的 结 点 */ 


e->next = G->adjList[j].firstedge; 


/* 将 当前 顶点 的 指针 指向 e */ 


G->adjList[j].firstedge = e; 
} 


这 里 加 粗 代码 ， 是 应 用 了 我 们 在 单 链 表 创 建 中 讲解 到 的 头 插 法 ， 由 于 
对 于 无 向 网 ， 一 条 边 对 应 都 是 两 个 项 点， 所 以 在 循环 中 ， 一 次 就 针对 i 
和 j 分 别 进行 了 插入 。 本 算法 的 时 间 复 杂 度 ， 对 于 n 个 顶点 e 条 边 来 说 ， 
很 容易 得 出 是 Onte)。 


743 十字 链表 


记得 看 过 一 个 创意 ， 我 非常 喜欢 。 说 的 是 在 美国 ， 晚 上 需要 保安 通过 
视频 监控 对 如 商场 超市 、 码 头 仓 库 、 办 公 写 字 楼 等 场所 进行 安保 工 

作 ， 如 图 7-4-9 所 示 。 值 夜班 代价 总 是 比较 大 的 ， 所 以 人 员 成 本 很 高 。 
我 们 国家 的 一 位 老兄 在 国内 经 常 和 美国 的 朋友 视频 聊天 ， 但 总 为 白天 
黑夜 的 时 差 苦恼， 突然 灵感 一 来 ， 想 到 一 个 绝妙 的 点 子 。 他 创建 一 家 
公司 ， 承 接 美 国 客 户 的 视频 监控 任务 ， 因 为 美国 的 黑夜 就 是 中 国 的 白 
天 ， 利 用 互联 网 ， 他 的 员工 白天 上 班 就 可 以 监控 到 美国 仓库 夜间 的 实 
际 情况 ， 如 果 发 生 了 像 火 灾 、 偷 盗 这样 的 突 发 事件 ， 及 时 电话 到 美国 
当地 相关 人 员 处 理 。 由 于 利用 了 时 差 和 人 员 成 本 的 优势 ， 这 位 老兄 发 
了 大 财 。 这 个 创意 让 我 们 知道 ， 充 分 利用 现 有 的 资源 ， 正 同 思 维 、 逆 
回电 维 、 整 合 思维 可 以 创造 更 大 价值 。 
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图 7-4-9 

那么 对 于 有 回 图 来 说 ， 邻 接 表 是 有 缺陷 的 。 关 心 了 出 度 问 题 ， 想 了 解 
入 度 束 必须 要 遍历 整个 图 才能 知道 ， 反 之 ， 逆 邻接 表 解 决 了 入 度 却 不 
了 解 出 度 的 情况 。 有 没有 可 能 把 邻接 表 与 逆 邻 接 表 结合 起 来 呢 ? 答案 
是 肯定 的 ， 丈 是 把 它们 整合 在 一 起 。 这 融 是 我 们 现在 要 讲 的 有 加 图 的 
一 种 存储 方法 : 十 字 链 表 (Orthogonal List) 。 

我 们 重新 定义 顶点 表 结 点 结构 如 表 7-4-1 所 示 。 


#27-4-1 


data firstin firstout 


HHH firstin KRAI RAHET, TAA AW PB Ma, 
firstout 表 示 出 边 表 头 指针 ， 指 向 该 顶点 的 出 边 表 中 的 第 一 个 结 点 。 


重新 定义 的 边 表 结 点 结构 如 表 7-4-2 所 示 。 


headlink | taillink 


TIAR 


其 中 tailvex 是 指 弧 起 点 在 顶点 表 的 下 标 ，headvex 是 指 弧 终 点 在 顶点 表 
中 的 下 标 ，headlink 是 指 入 边 表 指针 域 ， 指 癌 终 点 相同 的 下 一 条 边 ， 
taillink 是 指 边 表 指 针 域 ， 指 癌 起 点 相同 的 下 一 条 边 。 如 果 是 网 ， 还 可 以 
再 增加 一 个 weight 域 来 存储 权 值 。 


比如 图 7-4-10， 顶 点 依然 是 存 入 一 个 一 维 数 组 {v0,v1,v, ,v3}， 实 线 箭 
头 指 针 的 图 示 完 全 与 图 7-4-7 的 邻接 表 相 同 。 就 以 顶点 v0 来 说 ，firstout 
指向 的 是 出 边 表 中 的 第 一 个 结 点 va。 所 以 v0 边 表 结 点 的 headvex=3， 

而 tailvex 其 实 丈 是 当前 顶点 v A ΓΊΠ0, Atv, 只 有 一 个 出 边 顶 点 ， 所 
以 headlink 和 和 taillink 都 是 空 。 
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图 7-4-10 


我 们 重点 需要 来 解释 虚线 箭头 的 含义 ， 它 其 实 就 是 此 图 的 道 邻接 表 的 
表示 。 对 于 v 1 来 说 ， 它 有 两 个 顶点 v; 和 v , 的 入 边 。 因 此 vv 的 firstin 指 


向 顶点 v1 的 边 表 结 点 中 headvex 为 0 的 结 点 ， 如 图 7-4-10 右 图 中 的 Q)。 接 
着 由 入 边 结 点 的 headlink 指 向 下 一 个 入 边 顶点 v, ， 如 图 中 的 CD。 对 于 项 
Kvi ， 它 有 一 个 入 边 顶 点 v，， 所 以 它 的 firstin 指 癌 顶 点 v ,的 边 表 结 点 
中 headvex 为 1 的 结 点 ， 如 图 中 的 @)。 顶 点 v ,和 v ,也 是 同样 有 一 个 入 边 
顶点 ， 如 图 中 四 和 人 5 

十 字 链 表 的 好 处 就 是 因为 把 邻接 表 和 逆 邻 接 表 整合 在 了 一 起 ， 这 样 既 
容易 找到 以 v ;为 尾 的 弧 ， 也 容易 找到 以 v ;为 头 的 弧 ， 因 而 容易 求 得 顶 
点 的 出 度 和 入 度 。 而 且 它 除了 结构 复杂 一 点 外 ， 其 实 创建 图 算法 的 时 
间 复 杂 度 是 和 邻接 表 相 同 的 ， 因 此 ， 在 有 向 图 的 应 用 中 ， 十 字 链 表 是 
非常 好 的 数据 结构 模型 。 

7.4.4 ”邻接 多 重 表 

讲 了 有 向 图 的 优化 存储 结构 ， 对 于 无 向 图 的 邻接 表 ， 有 没有 问题 呢 ? 
如 果 我 们 在 无 向 图 的 应 用 中 ， 关 注 的 重点 是 顶点 ， 那 么 邻接 表 是 不 错 
的 选择 ， 但 如 果 我 们 更 关注 边 的 操作 ， 比 如 对 已 访问 过 的 边 做 标记 ， 
删除 某 一 条 边 等 操作 ， 那 就 意味 着 ， 需 要 找到 这 条 边 的 两 个 边 表 结 点 
进行 操作 ， 这 其 实 还 是 比较 磋 烦 的 。 比 如 图 7-4-11， 硅 要 删除 左 图 的 (v 
Vo ) 这 条 边 ， 需 要 对 邻接 表 结 构 中 右边 表 的 阴影 两 个 结 点 进行 删除 操 
作 ， 显 然 这 是 比较 烦琐 的 。 


中 


图 7-4-11 


下 标 data firstedge αἶνον next 


因此 ， 我 们 也 仿照 十 子 链 表 的 方式 ， 对 边 表 结 扣 的 结构 进行 一 些 改 
过 ， 也 许 束 可 以 避免 刚才 提 到 的 问题 。 


重新 定义 的 边 表 结 点 结构 如 表 7-4-3 所 示 。 


表 7-4-3 


其 中 ivex 和 jvex 是 与 某 条 边 依 附 的 两 个 顶点 在 顶点 表 中 的 下 标 。 ilink 
向 依 附 顶 点 ivex 的 下 一 条 边 ，jlink 指 所 向 依附 顶 s S wa FZ ο A 


是 邻接 多 重 表 结构 。 


我 们 来 看 结构 示意 图 的 绘制 过 程 ， 理 解 了 它 是 如 何 连 线 的 ， 也 就 理解 
邻接 多 重 表 构 造 原理 了 。 如 图 7-4-12 所 示 ， 左 图 告诉 我 们 它 有 4 个 顶点 
和 5 条 边 ， 显 然 ， 我 们 就 应 该 先 将 4 个 顶点 和 5 条 边 的 边 表 结 点 画 出 来 。 
由 于 是 无 问 图 ， 所 以 ivex 是 0、jvex 和 是 1 还 是 反 过 来 都 是 无 所 谓 的 ， 不 过 
为 了 绘图 方便 ， 都 将 ivex 值 设置 得 与 一 旁 的 顶点 下 标 相 同 。 


下 标 data firstedge ivex ilink jvex jlink 


oS 
=| 


图 7-4-12 


我 们 开始 连 线 ， 如 图 7-4-13。 首 先 连 线 的 QLX2X3X4) 就 是 将 顶 后 的 firstedge 
指 问 一 条 边 ， 顶 点 下 标 要 与 ivex 的 值 相同 ， 这 很 好 理解 。 接 春 ， 由 于 顶 
点 vo 的 (vovi) 边 的 邻 边 有 (vova) 和 (vovz)。 因 此 6 的 连 线 就 是 满 
足 指向 下 一 条 依附 于 顶点 v0 的 边 的 目标 ， 注 意 ilink 指 向 的 结 点 的 jvex 一 


定 要 和 它 本 喘 的 ivex 的 值 相同 。 同 样 的 道理 ， 连 线 CO 就 是 指 (vivo) 这 
条 边 ， 它 是 相当 于 顶点 v1 指向 (v1 ,v5) 边 后 的 下 一 条 。v, 有 三 条 边 依 
附 ， 所 以 在 (3 之 后 殊 有 了 (8X9。 连 线 Q0 的 就 是 顶点 Vv, 在 连 线 (4) 之 后 的 下 
一 条 边 。 左 图 一 共有 5 条 边 ， 所 以 右 图 有 10 条 连 线 ， 完 全 符合 预期 。 


ΜΗ data firstedge ivex ilink jvex jlink 


图 7-4-13 


到 这 里 ， 大 家 应 该 可 以 明日 ， 邻 接 多 重 表 与 邻接 表 的 考 别 ， 仅 仅 生 在 
于 同一 条 边 在 邻接 表 中 用 两 个 结 点 表示 ， 而 在 邻接 多 重 表 中 只 有 一 个 


ZE CREM ERE RL Re Γ, a SRA AAW 9 ,vs ) 这 条 边 ， 
只 需要 将 右 图 的 (6X9) 的 链接 指向 改 为 和 即 可 。 由 于 各 种 基本 操作 的 实现 
也 和 邻 授 表 是 相似 的 ， 这 里 我 们 残 不 讲解 代码 了 。 


7.4.5” 边 集 数 组 

边 集 数组 是 由 两 个 一 维 数组 构成 。 一 个 是 存储 顶点 的 信息 ; 另 一 个 是 
存储 边 的 信息 ， 这 个 边 数组 每 个 数据 元 素 由 一 AIEE FIN 
(begin) 、 终 点 下 标 (end) 和 权 (weight) 组 成 ， 如 图 7-4-14 所 示 。 
显然 边 集 数组 关注 的 是 边 的 集合 ， 在 边 集 数组 中 要 查找 一 个 顶点 的 度 
需要 扫描 整个 边 数 组 ， 效 率 并 不 高 。 因 此 它 更 适合 对 边 依次 进行 处 理 
的 操作 ， 而 不 适合 对 顶点 相关 的 操作 。 关 于 边 集 数组 的 应 用 我 们 将 在 
本 章 7.6.2 节 的 克 鲁 斯 卡尔 (Kruskal) 算法 中 有 介绍 ， 这 里 就 不 再 详 述 
Το 


ΠΕΡ 


edges[0] 
edges[1] 
edges[2] 


edges[3] 
edges[4] 
edges[5] 


图 7-4-14 
定义 的 边 数组 结构 如 表 7-4-4 所 示 。 


表 7-4-4 


begin end weight 

其 中 begin 征 存储 起 点 下 标 ，end 十 存储 终点 下 标 ，weight 是 存储 权 值 。 
7.5 图 的 过 历 

我 有 天 早 宕 准备 出 | ]|， 发 现 钥匙 不 见 了 。 昨 晚 还 看 到 它 ， 所 以 确定 钥 
十 在 家 里 。 一 定 是 我 那 三 岁 不 到 的 儿子 拿 着 玩 ， 不 知道 丢 到 哪个 特 角 
敬 天 去 了 ， 问 他 也 说 不 清楚 。 我 现在 必须 得 找到 它 ， 你 们 说 ， 我 应 该 


如 何 找 ? 介绍 我 们 家 的 结构 ， 如 图 7-5-1 所 示 ， 是 最 典型 的 两 室 两 厅 一 
厨 一 卫 一 阳台 。 


GC-4-A 
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图 7-5-1 


有 人 说 ， 往 小 孩子 经 常 玩 的 地 方 找 找 看 。OK， 我 照 做 了 ， 可 惜 没 找 
到 。 然 后 怎么 办 ? 有 人 说 一 间 一 间 找 ， 可 怎么 个 找 法 ? 是 把 一 间 房 间 
翻 个 改 朝 天 再 找 下 一 间 好 呢 ， 还 十 先 每 个 房间 的 最 第 去 的 位 置 找 一 
找 ， 然 后 再 一 步 一 步 细 化 到 每 个 房间 的 角落 ? 


这 是 一 个 大 家 都 可 能 会 面临 的 问题 ， 不 找 的 东西 时 常见 ， 需 要 的 东西 
寻 不 着 。 找 东西 的 策略 也 因 人 而 异 。 有 些 人 因为 找 东 西 没 有 规划 ， 当 
一 样 东西 找 不 到 时 ， 往 往 会 反复 地 找 ， 甚 至 肝 些 抽 敢 找 个 四 五 届 ， 羽 
一 些 地 方 却 一 次 也 没 找 过 。 找 东西 是 没有 什么 标准 方法 的 ， 不 过 今天 
我 们 学 过 了 图 的 裔 历 以 后 ， 你 至 少 应 该 在 找 东 西 时 ， 更 加 科学 地 规划 
寻找 方案 ， 而 不 至 于 手忙脚乱 。 


图 的 壳 历 是 和 树 的 遍历 类 似 ， 我 们 希望 从 图 中 某 一 顶点 出 发 访 遍 图 中 
其 余 顶 点 ， 且 使 每 一 个 顶点 仅 被 访问 一 次 ， 这 一 过 程 束 叫做 图 的 避 历 
(Traversing Graph) ° 
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多 了 ， 因 为 它 的 任 一 顶点 都 可 能 和 其 余 的 所 有 顶点 相 邻 接 ， 极 有 可 能 
存在 沿 着 某 条 路 径 搜索 后 ， 又 回 到 原 顶点 ， 而 有 些 顶 点 却 还 没有 裔 历 
到 的 情况 。 因 此 我 们 需要 在 人 直 历 过 程 中 把 访问 过 的 顶点 打上 标记 ， 以 
避免 访问 多 次 而 不 目 知 。 具 体 办 法 十 设置 一 个 访问 数组 visited[n]，n 是 
图 中 顶点 的 个 数 ， 初 值 为 0， 访 问 过 后 设置 为 1。 这 其 实在 小 说 中 各 般 
见 到 ， 一 行人 在 迷宫 中 迷 了 路 ， 为 了 避免 找寻 出 路 时 屡次 重复 ， 所 以 
会 在 路 口 用 小 刀 刻 上 标记 。 


对 于 图 的 裔 历来 说 ， 如 何 避 人 免 因 回 路 陷入 死 循 环 ， 就 需要 科学 地 设计 
ο πο ο ο σα 
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7.5.1 ”深度 优先 遍历 


深度 优先 遍历 (Depth_First_Search) ， 也 有 称 为 深度 优先 搜索 ， 简 称 
为 DFS。 它 的 具体 思想 束 如 同 我 刚才 提 到 的 找 钥 二 方案， 无 论 从 哪 一 间 
房间 开始 都 可 以 ， 比 如 主 卧 室 ， 然 后 从 房间 的 一 个 角 开 始 ， 将 房间 内 
的 墙角 、 床 头 杷 、 床 上 、 床 下 、 衣 杷 里 、 衣 杷 上 、 前 面 的 电视 柜 等 挨 


PIR, ΔΙ ΤΙΟΣΓΗΗΙΓΦΕΗ, MAE ν ΠΒΊΒΟΕ EB aT 
这， 形象 比喻 就 是 翻 个 底 朝 天 ， 然 后 再 寻找 下 一 间 ， 直 到 找到 为 止 。 


为 了 更 好 的 理解 深度 优先 遍历 ， 我 们 来 做 一 个 游戏 。 


假设 你 需要 完成 一 个 任务 ， 要 求 你 在 如 图 7-5-2 左 图 这 样 的 一 个 迷宫 
中 ， 从 顶点 A 开始 要 走 涡 所 有 的 图 顶点 并 作 上 标记 ， 注 意 不 古人 简单 地 看 
着 这 样 的 平面 图 走 哦 ， 而 苹 如 同 现实 般 地 在 只 有 融 墙 和 通道 的 迷宫 中 
去 完成 任务 。 


很 显然 我 们 是 需要 策略 的 ， 否 则 在 这 四 通 八 达 的 通道 中 乱 窜 ， 要 想 完 
ο ΤΙ ee 
难 完成 了 。 


首先 我 们 从 顶点 A 开 始 ， 做 上 表示 走 过 的 记号 后 ， 面 前 有 两 条 路 ， 通 加 
B 和 F， 我 们 给 目 己 定 一 个 原则 ， 在 没有 磁 到 重复 项 点 的 情况 下 ， 始 终 
征 问 右手 边 走 ， 于 是 走 到 了 B 顶 点 。 整 个 行路 过 程 ， 可 参看 图 7-5-2 的 右 
图 。 此 时 发 现 有 三 条 分 文 ， 分 别 通 回 顶 扣 C、I、G， 右 手 通行 原则 ， 使 
得 我 们 走 到 了 C 顶 点 。 就 这 样 ， 我 们 一 直 顺 着 右手 通道 走 ， 一 直 走 到 F 
顶点 。 当 我 们 依然 选择 右手 通道 走 过 去 后 ， 发 现 走 回 到 顶点 A 了 ， 因 为 
在 这 里 做 了 记号 表示 已 经 走 过 。 此 时 我 们 退回 到 顶点 FE， 走 向 从 右 数 的 
第 二 条 通道 ， 到 了 G 顶 点 ， 它 有 三 条 通道 ， 发 现 B 和 D 都 已 经 是 走 过 
TA ΝΥ 
ΕΤΗ Ὲ 


此 时 我 们 是 否 已 经 届 历 了 所 有 顶点 呢 ? 没有 。 可 能 还 有 很 多 分 文 的 顶 

氮 我 们 没有 走 到 ， 所 以 我 们 按 原 路 返回 。 在 顶点 H 处 ， 再 无 通道 没 走 

$, RERIG, WREDE, AEF, AME, EFE, Æ 

一 条 通道 通 往 H 的 通道 ， 难 证 后 也 是 走 过 的 ， 再 返回 到 顶点 D， 此 时 还 
有 三 条 道 未 走 过 ， 一 条 条 来 ，H 走 过 了 ，G 走 过 了 ，I， 哦 ， 这 是 一 个 新 
顶点 ， 没 有 标记 ， 赶 快 记 下 来 。 继 续 返 回 ， 直 到 返回 顶点 A， 确 认 你 已 
经 完成 笛 历 任务 ， 找 到 了 所 有 的 9 个 顶点 。 


反应 快 的 同学 一 定 会 感觉 到 ， 深 度 优先 角 历 其 实 束 古 一 个 递归 的 过 
程 ， 如 果 再 敏感 一 些 ， 会 发 现 其 实 转换 成 如 图 7-5-2 的 右 图 后 ， 就 像 是 
一 棵 树 的 前 序 遍 历 ， 没 错 ， 它 束 是 。 它 从 图 中 某 个 顶点 y 出 发 ， 访 问 此 
顶点 ， 然 后 从 v 的 未 被 访问 的 邻接 点 出 发 深度 优先 志 历 图 ， 直 至 图 中 所 
有 和 v 有 路 径 相通 的 顶点 都 被 访问 到 。 事 实 上， 我 们 这 里 讲 到 的 是 连通 
图 ， 对 于 非 连 通 图 ， 只 需要 对 它 的 连通 分 量 分 别 进行 深度 优先 志 历 ， 
即 在 先前 一 个 顶点 进行 一 次 深度 优先 裔 历 后 ， 铬 图 中 尚 有 顶点 未 被 访 
问 ， 则 男 选 图 中 一 个 未 曾 被 访问 的 顶点 作 起 始点 ， 重 复 上 壕 过 程 ， 直 
至 图 中 所 有 顶 后 部 被 访问 到 为 止 。 


如 琳 我 们 用 的 是 邻接 矩阵 的 方式 ， 则 代码 如 下 : 


/* Boolean 是 布尔 类 型 ， 其 值 是 TRUE 或 FALSE */ 


typedef int Boolean; 


/* 访问 标志 的 数组 */ 


Boolean visited[MAX]; 


/* 邻接 矩阵 的 深度 优先 递归 算法 */ 


void DFS(MGraph G, int i) 


i 
anita ης 
visited[i] = TRUE; 
/* 打印 项 点， 也 可 以 其 他 操作 */ 
ρω ος ο ο δις] 
for (j = 0; 1 < G.numVertexes; j++) 
if (G.arc[i][j] == 1 && !visited[j]) 
/* 对 为 访问 的 邻接 顶点 递归 调用 3/ 
DES(CGR 
} 


/* 邻接 矩阵 的 深度 遍历 操作 */ 
void DFSTraverse(MGraph G) 
ine ος 
for (i = 0; i < G.numVertexes; i++) 


/* 初始 所 有 顶点 状态 都 是 未 访问 过 状态 */ 


visited[i] = FALSE; 


for (i = 0; i < G.numVertexes; i++) 


/* 对 未 访问 过 的 顶点 调用 DFS， 若 是 连通 图 ， 只 会 执行 一 次 */ 


if (!visited[i]) 


DFS(G, i); 


代码 的 执行 过 程 ， 其 实 就 是 我 们 刚才 迷宫 找寻 所 有 顶点 的 过 程 。 


如 果 图 结构 是 邻接 表 结 构 ， 其 DFSTraverse 范 数 的 代码 是 几乎 相同 的 ， 
只 是 在 逮 归 函数 中 因为 将 数组 换 成 了 链表 而 有 不 同 ， 代 码 如 下 。 


/* 邻接 表 的 深度 优先 递归 算法 * 


void DFS(GraphAdjList GL, int i) 


{ 


} 


EdgeNode *p; 


visited[i] = TRUE; 


/* 打印 项 点， 也 可 以 其 他 操作 */ 
printf("%c ", GL->adjList[i].data); 
p = GL->adjList[i].firstedge; 

while (p) 


{ 


if (!visited[p->adjvex]) 


/* 对 为 访问 的 邻接 顶点 递归 调用 */ 
DFS(GL, p->adjvex); 


p = p->next; 


/* 邻接 表 的 深度 遍历 操作 */ 


void DFSTraverse(GraphAdjList GL) 


{ 


ΠΠ AEP 
for (i = 0; i < GL->numVertexes; i++) 


/* 初始 所 有 顶点 状态 都 是 未 访问 过 状态 */ 


visited[i] = FALSE; 


for (i = 0; i < GL->numVertexes; i++) 


/* 对 未 访问 过 的 顶点 调用 DFS， 若 是 连通 图 ， 


if (!visited[i]) 


DFS(GL, i); 


对 比 两 个 不 同 存 储 结构 的 深度 优先 遍历 算法 ， 对 于 n 个 顶点 e 条 边 的 图 
来 说 ， 邻 接 和 矩阵 由 于 是 二 维 数组 ， 要 查找 每 个 顶点 的 邻接 点 需要 访问 
和 矩阵 中 的 所 有 元 素 ， 因 此 都 需要 O(n 


2) 的 时 间 。 而 邻接 表 做 存储 结构 时 ， 找 邻接 点 所 需 的 时 间 取 决 于 顶点 和 
边 的 数量 ， 所 以 是 OO+ej。 显 然 对 于 点 多 边 少 的 稀 芒 图 来 说 ， 邻 接 表 
结构 使 得 算法 在 时 间 效率 上 大 大 提高 。 


对 于 有 问 图 而 言 ， 由 于 它 只 是 对 通道 存在 可 行 或 不 可 行 ， 算法 上 没有 
变化 ， 是 完全 可 以 通用 的 。 这 里 束 不 再 详 述 了 。 


7.5.2 广度 优先 遍历 


广度 优先 遍历 (Breadth_First_Search) ， 又 称 为 广度 优先 搜索 ， 简 称 
BFS。 还 是 以 找 钥匙 的 例子 为 例 。 小 孩子 不 太 可 能 把 钥 赴 丢 到 大 衣柜 顶 
上 或 厨房 的 油烟 机 里 去 ， 深 度 优先 遍历 意味 着 要 彻 故 查找 完 一 个 房间 
才 查 找 下 一 个 房间 ， 这 未 必 是 最 佳 方案 。 所 以 不 妨 先 把 家 里 的 所 有 房 
间 简 单 看 一 裔 ， 看 看 钥匙 是 不 是 就 放 在 很 显眼 的 位 置 ， 如 果 全 走 一 遍 
没有 ， 再 把 小 孩 在 每 个 房间 玩 得 最 多 的 地 方 或 各 个 家 俱 的 下 面 找 一 
找 ， 如 归还 是 没有 ， 那 看 一 下 每 个 房间 的 抽 慑 ， 这 样 一 步 步 扩 大 查找 
的 范围 ， 直 到 找到 为 止 。 事 实 上 ， 我 在 全 屋 查 找 的 第 二 饥 时 就 在 抽水 
马桶 后 面 的 地 板 上 找到 了 。 


如 采 说 图 的 深度 优先 遍历 类 似 树 的 前 序 裔 历 ， 那 么 图 的 广度 优先 遍历 
就 类 似 于 树 的 层 序 裔 历 了 。 我 们 将 图 7-5-3 的 第 一 幅 图 稍微 变形 ， 变 形 
原则 是 顶点 A 放置 在 最 上 第 一 层 ， 让 与 它 有 边 的 顶点 B、F 为 第 二 层 ， 

再 让 与 B 和 F 有 边 的 顶点 C、I、G、E 为 第 三 层 ， 再 将 这 四 个 顶点 有 边 的 
D、H 放 在 第 四 层 ， 如 图 7-5-3 的 第 二 幅 图 所 示 。 此 时 在 视觉 上 感觉 图 的 
形状 发 生 了 变化 ， 其 实 顶 点 和 边 的 关系 还 是 完全 相同 的 。 


图 7-5-3 
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广度 优先 裔 历 算 法 。 


/* 邻接 矩阵 的 广度 遍历 算法 */ 


void BFSTraverse(MGraph G) 
办 
alae. abe. ΠΣ 
Queue Q; 
for (i = 0; i < G.numVertexes; i++) 


visited[i] = FALSE; 


/* 初始 化 一 辅助 用 的 队列 */ 


InitQueue(&Q); 


/* 对 每 一 个 顶点 做 循环 */ 


for (i = 0; i < G.numVertexes; i++) 


{ 


/* eA ARAN «, 


if (!visited[i]) 


{ 


/* 设置 当前 顶点 访问 过 */ 


visited[i]=TRUE; 


/* 打印 顶点 ， 也 可 以 其 他 操作 */ 


πας ο νοκ) 
/* 将 此 顶点 入 队列 3/ 
EnQueue(&Q,i); 


/* 若 当前 队列 不 为 空 */ 


while (!QueueEmpty(Q) ) 


{ 


/* HB PICR HS, ΙΑΒ΄Β1 */ 


DeQueue(&Q, &i); 
for (j = 0; j < G.numVertexes; j++) 


{ 


/* 判断 其 他 顶点 若 与 当前 顶点 存在 边 且 未 访问 过 */ 


if (G.arc[i][j] == 1 && !visited[j]) 
{ 
/* 将 找到 的 此 顶点 标记 为 已 访问 */ 


visited[j]=TRUE; 

fe Ne NU E 

Dan fe GAVE Xs lal) 
/* 将 找到 的 此 顶点 入 队列 */ 


EnQueue(&Q,j); 


对 于 邻接 表 的 广度 优先 裔 历 ， 代 码 与 邻接 和 矩阵 差异 不 大 ， 代 码 如 下 。 


/* 邻接 表 的 广度 遍历 算法 */ 


void BFSTraverse(GraphAdjList GL) 
ή 
inte is 
EdgeNode *p; 
Queue Q; 
for (i = 0; i < GL->numVertexes; i++) 
visited[i] = FALSE; 
InitQueue(&Q); 
for (i = 0; i < GL->numVertexes; i++) 
{ 


if (!visited[i]) 


visited[i] = TRUE; 


/* 打印 顶点 ， 也 可 以 其 他 操作 */ 


printf("%c ", GL->adjList[i].data); 
EnQueue(&Q, i); 


while (!QueueEmpty(Q) ) 


{ 
DeQueue(&Q, &i); 
/* 找到 当前 顶点 边 表 链表 头 指针 3/ 
p = GL->adjList[i].firstedge; 
while (p) 
{ 
/* 若 此 顶点 未 被 访问 */ 
if (!visited[p->adjvex]) 
£ 
visited[p->adjvex] = TRUE; 
printf("%c ", GL->adjList[p->adjvex].data); 
/* 将 此 顶点 入 队列 */ 
EnQueue(&Q, p->adjvex); 
} 
/* ΠΗΤΗΗΗ ΤΡ 4Ρβε */ 
p = p->next; 
} 
} 


对 比 图 的 深度 优先 遍历 与 广度 优先 遍历 算法 ， 你 会 发 现 ， 它 们 在 时 间 

复杂 度 上 是 一 样 的 ， 不 同 之 处 仅仅 在 于 对 顶点 访问 的 顺序 不 同 。 可 见 

ο 遍历 上 是 没有 优 劣 之 分 的 ， 只 是 视 不 同 的 情况 选择 不 同 的 
> 


ΑΠΕ A AAR se , ANTE RY ΗΡΙ SC, a) BE) 
EA ΓΚ ANI, ASA eR i AMY Γ ΡΕ 
先 更 适合 目标 比较 明确 ， 以 找到 目标 为 主要 目的 的 情况 ， 而 广度 优先 
更 适合 在 不 断 扩大 遍历 范围 时 找到 相对 最 优 解 的 情况 。 


这 里 还 要 再 多 说 几 句 ， 对 于 深度 和 广度 而 言 ， 已 经 不 是 简单 的 算法 实 
现 问题 ， 完 全 可 以 上 升 到 方法 论 的 角度 。 你 求学 是 博览 群 书 、 不 求 其 
fe, DERMO > MFA E, MIRU ERESMA ` ERK, OE 
Γ 马 看 化 、 深 度 体 验 ; MEREEN ELE, DEAE A 
足 疾 .….. 其 实 都 无 对 错 之 分 ， 只 视 不 同人 的 理解 而 有 了 不 同 的 诠释 。 
我 个 人 觉得 深度 和 广度 是 既 矛 盾 义 统一 的 两 个 方面 ， 偏 颇 都 不 可 取 ， 
还 望 大 家 目 己 慢 慢 体会 。 


76 ”最 小 生成 树 


假设 你 是 电信 的 实施 工程 师 ， 需 要 为 一 个 镇 的 九 个 村 庄 架 设 通信 网 络 
做 设计 ， 村 庄 位 置 大 致 如 图 7-6-1， 其 中 vo “να 是 村 庄 ， 之 间 连 线 的 数 
字 表 示 村 与 村 间 的 可 通达 的 直线 距离 ， 比 如 v Ev 就 是 10 公 里 (个 别 
如 v0 与 Ve ，vV6 vg, ，v5 与 vy 未 测算 距离 是 因为 有 高 山 或 湖泊 ， 不 予 
ο 你们 领导 要 求 你 必须 用 最 小 的 成 本 完成 这 次 任务 。 你 说 怎么 


图 7-6-1 
显然 这 是 一 个 带 权 值 的 图 ， 即 网 结构 。 所 谓 的 最 小 成 本 ， 就 是 n 个 顶 
点 ， 用 n-1 条 边 把 一 个 连通 图 连接 起 来 ， 并 旦 使 得 权 值 的 和 最 小 。 在 这 
个 例子 里 ， 每 多 一 公里 就 多 一 份 成 本 ， 所 以 只 要 让 线路 连 线 的 公里 数 
最 少 ， 就 是 最 少 成 本 了 。 

如 果 你 加 班 加 点 ， 没 日 没 夜 设计 出 的 结果 是 如 图 7-6-2 的 方案 一 ( 粗 线 
为 要 架设 线路 ) ， 我 想 你 离 被 炒 钱 鱼 应 该 是 不 远 了 (同学 微笑 ) 。 因 
为 这 个 方案 比 后 两 个 方案 多 出 60% 的 成 本 会 让 老板 气量 过 去 的 。 


方案 一 方案 二 
公里 数 =11+26+20+22+18+21+24+19=161 。 公里 数 =8+]12+10+11+17+19+16+7=100 
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方案 二 
公里 数 =8+12+10+11+16+19+16+7=99 


图 7-6-2 


方案 三 设计 得 非常 巧妙 ， 但 也 只 以 极其 微弱 的 优势 对 方案 二 胜出 ， 应 
URE 3 我 们 有 没有 办 法 可 以 精确 计算 出 这 种 网 图 的 最 佳 方案 
We? 答案 当然 是 Yes。 


我 们 在 讲 图 的 定义 和 术语 时 ， 曾 经 提 到 过 ， 一 个 连通 图 的 生成 树 是 一 
个 极 小 的 连通 子 图 ， 它 含有 图 中 全 部 的 顶点 ， 但 只 有 足以 构成 一 棵 树 
的 n-1 条 边 。 显 伏 图 7-6-2 的 三 个 方案 都 是 独 7-6-1 的 网 图 的 生成 树 。 那 么 
我 们 把 构造 连通 网 的 最 小 代价 生成 树 称 为 最 小 生成 树 (Minimum Cost 


SpanningTree) 


找 连通 网 的 最 小 生成 树 ， ο 普 里 姆 算法 和 克 和 鲁 斯 卡 
不 算法 。 我 们 就 分 别 来 介绍 一 


7.6.1 ŽE (Prim) 算法 


为 了 能 讲 明日 这 个 算法 ， 我 们 先 构 造 独 7-6-1 的 邻接 矩阵 ， 如 图 7-6-3 的 
右 图 所 示 。 


Yo Vi Vo V3 VW V5 Ve V7 Ve 


16 ή 
4 Ὁ 0 yio ο 22 0 20 ο 24 16 2l 
εἰν) 4 ἢ ulo ο o 20 0 36 ο 7 α 
$ Ww œ œ 2 0 17 ου ο 
ν ) 


图 7-6-3 


也 就 是 说 ， 现 在 我 们 已 经 有 了 一 个 存储 结构 为 MGragh 的 G ( 见 本 书 7.4 
节令 接 和 矩阵 ) 。G 有 9 个 顶点 ， 它 的 arc 二 维 数 组 如 图 7-6-3 的 右 图 所 示 。 
数组 中 的 我 们 用 65535 来 代表 oo 。 


是 普 里 姆 (Prim) 算法 代码 如 下 ， 左 侧 数字 为 行 号 。 其 中 INFINITY 
为 权 值 极 大 值 ， 不 妨 是 65535，MAXVEX 为 顶点 个 数 最 大 值 ， 此 处 大 
于 等 于 9 即 可 。 现 在 假设 我 们 目 己 丈 是 计算 机 ， 在 调用 
MiniSpanTree_Prim 芳 数 ， 输 入 上 壕 的 邻 授 矩阵 后 ， 看 看 它 是 如 何 运 行 
并 打印 出 最 小 生成 树 的 。 


/* Prim 算 法 生成 最 小 生成 树 */ 


void MiniSpanTree_Prim(MGraph G) 


ime man ὑπ κο 

/* 保存 相关 顶点 下 标 “/ 

int adjvex[MAXVEX]; 

/* 保存 相关 顶点 间 边 的 权 值 */ 
int lowcost [ΜΑΧΝΕΧ1; 


/* 初始 化 第 一 个 权 值 为 9， 即 vV @ 加 入 生成 树 */ 


/* 1owcost 的 值 为 0， 在 这 里 就 是 此 下 标的 顶点 已 经 加 入 生成 树 */ 


lowcost[0] = 0; 
/* 初始 化 第 一 个 顶点 下 标 为 9 */ 
adjvex[0] = 0; 


/* 循环 除 下 标 为 9 外 的 全 部 顶点 */ 


for (i = 1; i < G.numVertexes; i++) 
{ 
/* 将 v o 顶点 与 之 有 边 的 权 值 存 入 数组 */ 


lowcost[i] = G.arc[0][i]; 
/* 初始 化 都 为 x ϱ 的 下 标 */ 
adjvex[i] = 0; 


for (i = 1; i < G.numVertexes; i++) 


/* 初始 化 最 小 权 值 为 »， */ 


/* 通常 设置 为 不 可 能 的 大 数字 如 32767、65535 等 */ 


min = INFINITY; 
jai; k= 0; 


/* 循环 全 部 顶点 */ 


while (j < G.numVertexes) 


{ 


/* 如 果 权 值 不 为 9 且 权 值 小 于 min */ 


if (lowcost[j] != 0 && lowcost[j] < min) 


/* 则 让 当前 权 值 成 为 最 小 值 */ 


min = lowcost[j]; 


/* 将 当前 最 小 值 的 下 标 存 入 K */ 


x= 


/* 打印 当前 顶点 边 中 权 值 最 小 边 */ 


printf("(%d,%d)", adjvex[k], k); 


/* 将 当前 顶点 的 权 值 设置 为 9， 表示 此 顶点 已 经 完成 任务 */ 


lowcost[k] = 0; 


/* 循环 所 有 顶点 */ 


for (j = 1; j < G.numVertexes; j++) 


iL 
/* 若 下 标 为 k 顶 点 各 边 权 值 小 于 此 前 这 些 顶 点 未 被 加 入 生成 树 权 值 “/ 
if (lowcost[j] != © && G.arc[k][j] < lowcost[j]) 
{ 
/* 将 较 小 权 值 存 入 Lowcost */ 
lowcost[j] = G.arc[k][j]; 
/* 将 下 标 为 k 的 顶点 存 和 adjvex */ 
adjvex[j] = k; 
} 
} 


1. 程序 开始 运行 ,我们 由 第 4~5 行 ， 创 建 了 两 个 一 维 数 组 lowcost 和 
adjvex， 长 度 都 为 顶点 个 数 9。 它 们 的 作用 我 们 慢 慢 细 说 。 

De, 第 6 一 7 行 我 们 分 别 给 这 两 个 数组 的 第 一 个 下 标 位 赋值 为 0， 
adjvex[0]=0 其 实意 思 了 就 是 我 们 现在 从 顶点 vu 开 始 〈 事 实 上， 最 小 生成 


树 从 哪个 顶点 开始 计算 都 无所谓， 我 们 假定 从 vo 开始) , lowcost[0]=0 
束 表 示 vo 已 经 被 纳入 到 最 小 生成 树 中 ， 之 后 凡是 lowcost 效 组 中 的 值 被 
设置 为 0 加 是 表示 此 下 标的 顶点 被 纳入 最 小 生成 树 。 


3. 第 8 一 12 行 表示 我 们 读 取 图 7-6-3 的 右 图 邻 授 矩阵 的 第 一 行 数据 。 将 
数值 赋值 给 lowcost 数 组 ， 所 以 此 时 lowcost 数 组 值 为 
{0,10,65535,65535,65535,11,65535,65535,65535} ， 而 adjvex 则 全 部 为 0。 
此 时 ， 我 们 已 经 完成 了 整个 初始 化 的 工作 ， 准 备 开始 生成 。 


4. 第 13~36 行 ， 整 个 循环 过 程 就 是 构造 最 小 生成 树 的 过 程 。 
5. 第 15~16 行 ， 将 min 设 置 为 了 一 个 极 大 值 65535， 它 的 目的 是 为 了 之 


后 找到 一 定 范围 内 的 最 小 权 值 。j 是 用 来 做 顶点 下 标 循环 的 变量 ，k 走 用 
来 存储 最 小 权 值 的 项 点 下 标 。 


6. 第 17~25 行 ， 循 环 中 不 断 修 改 min 为 当前 lowcost 数 组 中 最 小 值 ， 并 
用 kk 保留 此 最 小 值 的 顶点 下 标 。 经 过 循环 后 ，min=10，k=1。 注 意 19 行 让 
判断 的 lowcost[j]!=0 表 示 已 经 是 生成 树 的 顶点 不 参与 最 小 权 值 的 查找 。 


7. 第 26 行 ， 因 k=1，adjvex[1]=0， 所 以 打印 结果 为 (0,1)， 表 示 vo Ev] 
边 为 最 小 生成 树 的 第 一 条 边 。 如 图 7-6-4 所 示 。 
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图 7-6-4 


8. 第 27 行 ， 此 时 因 k=1 我 们 将 lowcost[k]=0 就 是 说 顶点 v1 纳入 到 最 小 生 
成 树 中 。 此 时 lowcost 数 组 值 为 
{0,0,65535,65535,65535,11,65535,65535,65535} ° 

9, 28~3547, jJ H128, Ak=1, ERIRE RE Ay ; 行 的 各 个 
AIA, Slow-costh XT MELEE, € ENE Aow-costlE, 34 ΠΕ 


入 adjvex 数 组 中 。 因 第 v; 行 有 18、16、12 均 比 65535 小 ， 所 以 最 终 
lowcost 数 组 的 值 为 : {0,0,18,65535,65535,11,16,65535,12}。adjvex 数 组 
的 值 为 : {0,0,10,0,0,10,1}。 这 里 第 30 行 这 判断 的 lowcost[j]!=0 也 说 明 v ϱ 
Aly | 已 经 是 生成 树 的 顶点 不 参与 最 小 权 值 的 比 对 了 。10. 再 次 循环 ， 
由 第 15 行 到 第 26 行 ， 此 时 min=11，k=5，adjvex[5]=0。 因 此 打印 结构 为 
(0,5)。 表 示 v0 至 vs 边 为 最 小 生成 树 的 第 二 条 边 ， 如 图 7-6-5 所 示 。 
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图 7-6-5 


11. 接 下 来 执行 到 36 行 ，lowcost 数 组 的 值 为 : 
{0,0,18,65535,26,0,16,65535,12}。ad-jvex 数 组 的 值 为 ; 

{0,0,1,0,5,0,1,0,1} ° 12. 之 后 ， 相 信 大 家 也 都 会 日 己 去 模拟 了 。 通 过 不 
断 的 转换 ， 构 造 的 过 程 如 图 7-6-6 中 图 1 一 图 6 所 示 。 
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图 7-6-6 


有 了 这 样 的 讲解 ， 再 来 介绍 普 里 姆 (Prim) 算法 的 实现 定义 可 能 就 容 
易 理 解 一 些 。 


假设 N=(V,{E}) 是 连通 网 ，TE 是 N 上 最 小 生成 树 中 边 的 集合 。 算 法 从 U= 
{uo }(uo EV)，TE={} 开 始 。 重 复 执 行 下 壕 操 作 ， 在 所 有 uEU,vEV-U 的 
边 (u,v)EE 中 找 一 条 代价 最 小 的 边 (uo,vo) 并 入 集合 TE， 同 时 v0 并 入 
r , ο 此 时 TE 中 必 有 n-1 条 边 ， 则 T=(V{ITE)) 为 N 的 最 小 生 
Ta 
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7.6.2 WERF (Kruskal) 算法 


现在 我 们 来 换 一 种 思考 方式 ， 普 里 姆 (Prim) 算法 是 以 某 顶 点 为 起 
点 ， 逐 步 找 各 顶点 上 最 小 权 值 的 边 来 构建 最 小 生成 树 的 。 这 就 像 是 我 
们 如 条 去 参观 某 个 展会 ， 例 如 世博 会 ， 你 从 一 个 入 口 进去 ， 然 后 找 你 
所 在 位 置 周边 的 场馆 中 你 最 感 兴趣 的 场馆 观光 ， 看 完 后 再 用 同样 的 办 
法 看 下 一 个 。 可 我 们 为 什么 不 事先 计划 好 ， 进 园 后 直接 到 你 最 想 去 的 
场馆 观看 呢 ? 事实 上 去 世博 园 的 观众 ， 绝 大 多 数 都 是 这 样 做 的 。 


同样 的 思路 ， 我 们 也 可 以 直接 就 以 边 为 目标 去 构建 ， 因 为 权 值 是 在 边 
上 ， 直 接 去 找 最 小 权 值 的 边 来 构建 生成 树 也 是 很 自然 的 想法 ， 只 不 过 
构建 时 要 考虑 是 否 会 形成 环 路 而 已 。 此 时 我 们 融 用 到 了 图 的 存储 结构 
中 的 边 集 数组 结构 。 以 下 是 edge 边 集 数组 结构 的 定义 代码 : 


/* 对 边 集 数组 Edge 结 构 的 定义 */ 
typedef struct 
at 

int begin; 

int end; 

int weight; 


} Edge; 


我 们 将 图 7-6-3 的 邻接 矩阵 通过 程序 转化 为 图 7-6-7 的 右 图 的 边 集 数组 ， 
并 且 对 它们 按 权 值 从 小 到 大 排序 。 
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图 7-6-7 


于 是 克 和 鲁 斯 卡尔 (Kruskal) 算法 代码 如 下 ， 左 侧 数字 为 行 号 。 其 中 
MAXEDGE 为 边 数量 的 极 大 值 ， 此 处 大 于 等 于 15 即 可 ，MAXVEX 为 顶 
点 个 数 最 大 值 ， 此 处 大 于 等 于 9 即 可 。 现 在 假设 我 们 自己 就 是 计算 机 ,， 


TEW H MiniSpanTree_Kruskal Kğ, ΠῚ \A17-6-36 BRISBEN, Ἔ 
看 它 是 如 何 运 行 并 打印 出 最 小 生成 树 的 。 


/* Kruskal 算 法 生成 最 小 生成 树 */ 


Vax 


生成 最 小 生成 树 */ 


void MiniSpanTree_Kruskal(MGraph 6) 


5 
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/* 定义 边 集 数组 */ 


Edge edges[MAXEDGE]; 


/* 定义 一 数组 用 来 判断 边 与 边 是 否 形成 环 路 */ 


int parent[MAXVEX] ; 


/* 此 处 省 上 略 将 邻接 矩阵 6 转化 为 边 集 数组 edges 
按 权 由 小 到 大 排序 的 代码 */ 


for (i = 0; i < G.numVertexes; i++) 


/* 初始 化 数组 值 为 9 */ 
parent[i] = 0; 


/* 循环 每 三 条 边 */ 


for (i = 0; i < G.numEdges; i++) 

{ 
n = Find(parent, edges[i].begin); 
m = Find(parent, edges[i].end); 


/* 假如 n 与 m 不 等 ， 说 明 此 边 没有 与 现 有 生成 树 形成 环 路 */ 


if (η != m) 
{ 
/* 将 此 边 的 结尾 顶点 放 入 下 标 为 起 点 的 parent 中 */ 


/* 表示 此 顶点 已 经 在 生成 树 集合 中 */ 


parent[n] = m; 
printf("(%d, %d) %d ", edges[i].begin, 


edges[i].end, edges[i].weight) ; 


} 


/* 查找 连 线 顶点 的 尾部 下 标 */ 


Intend Gnt aparent ents) 
if 
while (parent[f] > 0) 
f = parent[f]; 
return f; 


} 


1. 程序 开始 运行 ， 第 5 行 之 后 ， 我 们 省 略 挥 颇 占 篇 幅 但 却 很 容易 实现 
的 将 邻接 矩阵 转换 为 边 集 数组 ， 并 按 权 值 从 小 到 大 排序 的 代码 ， 也 就 
是 说 ， 在 第 5 行 开始 ， 我 们 已 经 有 了 结构 为 edge， 数 据 内 容 是 图 7-6-7 的 
石 图 的 一 维 数组 edges 5 


2, 第 5~7 行 ,我们 声明 一 个 数组 parent， 并 将 它 的 值 都 初始 化 为 0， 它 
的 作用 我 们 后 面 慢 慢 说 。 

3. 第 8 一 17 行 ， 我 们 开始 对 边 集 数组 做 循环 雹 历 ， 开 始 时 ，i=0 。 

4. 第 10 行 ， 我 们 调用 了 第 19 一 25 行 的 函数 Find， 传 入 的 参数 是 数组 
parent 和 当前 权 值 最 小 边 (v4,vz) 的 begin:4。 因 为 parent 中 全 都 是 0 所 以 
传 出 值 使 得 n=4。 


5. 第 11 行 ， 同 样 作法 ， 传 入 (vy ,vy ) 的 end:7。 传 出 值 使 得 m=7。 
6. 第 12 一 16 行 ， 很 显然 n 与 m 不 相等 ， 因 此 parent[4]=7。 此 时 parent 数 


组 值 为 {0,0,0,0,7,0,0,0,0}， 并 且 打 印 得 到 “(4,7)7”。 此 时 我 们 已 经 将 边 (v 
4;V7) 纳 入 到 最 小 生成 树 中 ， 如 图 7-6-8 所 示 。 


图 7-6-8 


7. 循环 返回 ， 执 行 10~~16 行 ， 此 时 i=1，edge[1] 得 到 边 (Vv , ,vs)，n=2， 
m=8，par-ent[2]=8， 打 印 结果 为 “(2,8)8”， 此 时 parent 数 组 值 为 
{0,0,8,0,7,0,0,0,0} ， 这 也 就 表示 边 (v4 ,Vy) 和 边 (v, ,vg) 已 经 纳入 到 最 小 
生成 树 ， 如 图 7-6-9 所 示 。 
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8. FHKEYTIO~1677, HERti=2, εὐρο[2|831|1{(ν αν 1), n=0, m=1, 
parent[0]=1， 打 印 结果 为 “(0,1D)10”， 此 时 parent 数 组 值 为 
{1,0,8,0,7,0,0,0,0}， 此 时 边 (vy ,vy)、(vV5;Vg) 和 (Vo,v1) 已 经 纳入 到 最 小 
生成 树 ， 如 图 7-6-10 所 示 。 
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图 7-6-10 


9. 当 i=3、4、5、6 时 ， η 、 
2 JJ 别 将 12] (ν 、 
A | ΕΗ, ` 0 V 5 ) (v ΤΙ ν 4 
o o 如 图 7-6-11 所 示 。 μα “ee 
A p BA RRINE EFESE? 
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图 7-6-11 


从 图 7-6-11 的 右 下 方 的 图 二 6 的 粗 线 连 线 可 以 得 到 ， 我 们 其 实 是 有 两 个 
连通 的 边 集 合 A 与 B 中 纳入 到 最 小 生成 树 中 的 ， 如 图 7-6-12 所 示 。 妆 


parent[0]=1， 表 示 vo 和 vi; 已 经 在 生成 树 的 边 集 合 A 中 。 此 时 将 
parent[0]=1 的 1 改 为 下 标 ， 由 par-ent[1]=5， 表 示 v1 和 vs 在 边 集 合 A 中 ， 
par-ent[5]=8 表 示 vV 5 与 Vg 在 边 集 合 A 中 ，par-ent[8]=6 表 示 v8g 与 V6 在 边 集 
合 A 中 ，par-ent[6]=0 表 示 和 集合 A 和 暂时 到 头 ， 此 时 边 集 合 A 有 vo “νι Vs 
`va ` Vve ° 我 们 查看 parent 中 没有 查看 的 值 ，parent[2]=8 表 示 vV，, 与 v8 
在 一 个 集合 中 ， 因 此 v ο 也 在 边 集 合 A 中 。 再 由 parent[3]=7、par-ent[4]=7 
和 parent[7]=0 可 知 vs。、v4、Vz 在 男 一 个 边 集 合 B 中 。 
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图 7-6-12 


10. 当 i=7 时 ， 第 10 行 ， 调 用 Find 函 数 ， 会 传 入 参数 edges[7].begin=5 ο 
此 时 第 21 行 ，parent[5]=8>0， 所 以 f=8， 再 循环 得 par-ent[8]=6。 
parent[6]=0 所 以 Find 返 回 后 第 10 行 得 到 n=6。 而 此 时 第 11 行 ， 传 入 参数 
edges[7].end=6 得 到 m=6。 此 时 n=m， 不 再 打印 ， 继 续 下 一 循环 。 这 束 告 
诉 我 们 ， 因 为 边 (v cov, ) 使 得 边 集合 A 形成 了 环 路 。 因 此 不 能 将 它 纳 入 
到 最 小 生成 树 中 ， 如 图 7-6-12 所 示 。11. 当 i=8 时 ， 与 上 面相 同 ， 由 于 
边 (vl,v?) 使 得 边 集 合 A 形 成 了 环 路 。 因 此 不 能 将 它 纳 入 到 最 小 生成 树 
中 ， 如 图 7-6-12 所 示 。12. 当 i=9 时 ， 边 (vevy)， 第 10 行 得 到 n=6， 人 第 
11 行 得 到 m=7， 因 此 parent[6]=7， 打 印 “(6,7)19”。 此 时 parent 数 组 值 为 
{1,5,8,7,7,8,7,0,6} ， 如 图 7-6-13 所 示 。13. 此 后 边 的 循环 均 造 成 环 路 ， 
最 终 最 小 生成 树 即 为 图 7-6-13 所 示 。 
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图 7-6-13 
好 了 ， 我 们 来 把 克 鲁 斯 卡尔 (Kruskal) 算法 的 实现 定义 归纳 一 下 结 
这 一 下 的 讲解 。 


假设 N=(V{E)) 是 连通 网 ， 则 令 最 小 生成 树 的 初始 状态 为 只 有 n 个 顶点 而 
无 边 的 非 连 通 图 T={V,{}}， 图 中 每 个 顶点 目 成 一 个 连通 分 量 。 在 E 中 这 
择 代 价 最 小 的 边 ， 夯 该 边 依附 的 项 后 落 在 T 中 不 同 的 连通 分 量 上 ， 则 将 


此 边 加 入 到 T 中 ， 否 则 售 去 此 边 而 选择 下 一 条 代价 最 小 的 边 。 依 次 类 
推 ， 直 至 T 中 所 有 顶点 都 在 同一 连通 分 量 上 为 止 。 


此 算法 的 Find 函 数 由 边 数 e 决 定 ， 时 间 复 杂 度 为 O(loge)， 而 外 面 有 一 个 
for 循 环 e 次 。 所 以 克 鲁 斯 卡尔 算法 的 时 间 复 杂 度 为 O(eloge)。 


对 比 两 个 算法 ， 克 和 鲁 斯 卡尔 算法 主要 是 针对 边 来 展开 ， 边 数 少 时 效率 
会 非常 高 ， 所 以 对 于 稀疏 图 有 很 大 的 优势 ,而 普 里 姆 算法 对 于 稠密 
图 ， 即 边 数 非常 多 的 情况 会 更 好 一 些 。 


7.7 ”最短 路径 


我 们 时 常会 面临 着 对 路 径 选 择 的 决策 问题 。 例 如 在 北京 、 上海、 广州 
等 城市 ， 因 其 城市 面积 较 大 ， 乘 地 铁 或 公交 都 要 考虑 从 A 点 到 B 点 ， 如 
何 换 乘 到 达 ? 比如 图 7-7-1 这 样 的 地 铁 网 图 ， 如 果 不 是 专门 去 做 研究 ， 
对 于 刚 接触 的 人 来 说 ， 都 会 犯 迷糊 。 


现实 中 ， 每 个 人 需求 不 同 ， 选 择 方案 就 不 尽 相 同 。 有 人 为 了 省 钱 ， 它 
需要 的 是 路 程 最 短 (定价 以 路 程 长 短 为 标准 ) ， 但 可 能 由 于 线路 班次 
少 ， 换 乘 站 间距 离 长 等 原因 并 不 省 时 间 ; 而 另 一 些 人 ， 为 了 要 赶 飞机 
火车 或 者 早晨 上 班 不 迟到 ， 他 最 大 的 需求 是 总 时 间 要 短 ， 还 有 一 类 

人 ， 如 老人 行动 不 便 ， 或 者 上 班 族 下 班 ， 忙 胡 一 天 毗 得 要 死 ， 他 们 都 
不 想 多 走路 ， 哪 但 车子 绕 远 路 耗 时 长 也 无 所 谓 ， 关 键 是 换 乘 要 少 ， 这 
样 可 以 在 车 上 好 好 休息 一 下 《有些 线路 方案 换 乘 两 次 比 换 乘 三 四 次 耗 
时 还 长 ) 。 这 些 都 是 老百姓 的 需求 ， 简 单 的 图 形 可 以 靠 人 的 经 验 和 感 
觉 ， 但 复杂 的 道路 或 地 铁 网 就 需要 计算 机 通过 算法 计算 来 提供 最 佳 的 
方案 。 我 们 今天 就 要 来 研究 关于 图 的 最 短路 径 的 问题 。 
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图 7-7-1 


在 网 图 和 非 网 图 中 ， 最 短路 径 的 含义 是 不 同 的。 由 于 非 网 图 它 没 有 边 
上 的 权 值 ， 所 谓 的 最 短路 径 ， 其 实 就 是 指 两 顶点 之 间 经 过 的 边 数 最 少 
的 路 径 ， 而 对 于 网 图 来 说 ， 最 短路 径 ， 古 指 两 顶 扣 之 间 经 过 的 边 上 权 
值 之 和 最 少 的 路 径 ， 并 且 我 们 称 路 径 上 的 第 一 个 顶点 是 源 点 ， 最 后 一 
个 顶点 是 终点 。 显 然 ， 我们 研究 网 图 更 有 实际 意义 ， 束 地 图 来 说 ， 距 
离 丈 是 两 顶点 间 的 权 值 之 和 。 而 非 网 图 完全 可 以 理解 为 所 有 的 边 的 权 
值 都 为 1 的 网 。 


我 们 要 讲解 两 种 求 最 短路 径 的 算法 。 先 来 讲 第 一 种 ， 从 某 个 源 点 到 其 
余 各 顶点 的 最 短路 径 问 题 。 


你 能 很 快 计 算出 图 7-7-2 中 由 源 点 v0 到 终点 vs 的 最 短路 径 吗 ? 如 果 不 

能 ， 没 关系 ， 我 们 一 同 来 研究 看 如 何 让 计算 机 计算 出 来 。 如 采 能 ， 呼 

哼 ， 那 仅 代 表 你 智商 还 不 错 ， 你 还 是 要 来 好 好 学 习 ， 毕 竞 真实 世界 的 

Z ο ο ο ο σος 
， 我 1 ΠΠ, ο 


图 7-7-2 

7.7.1 迪 杰 斯 特 拉 (Dijkstra) 算法 

这 是 一 个 按 路 径 长 度 递增 的 次 序 产生 最 短路 径 的 算法 。 它 的 思路 大 体 
是 这 样 的 。 

比如 说 要 求 图 7-7-3 中 顶点 vo 到 顶点 v1 的 最 短 距 离 ， 没 有 比 这 更 人 简单 的 
了 ， 答 案 就 是 1， 路 径 就 是 直接 v 连 线 到 vi 。 


7-7-3 
由 于 顶点 v1 还 与 v。 FMS v4 连 线 ， 所 以 此 时 我 们 同时 求 得 了 v0 ΝΗ 


>v, =1+3=4, Vo => Nj =r vV 3 =1+7=8, Vo νι >V4=1+5=6 5 


INE, Φε[ῆν o Flv AEB, WRK MRE ies, BALES 
了 。 因 为 边 上 都 有 权 值 ， 刚 才 已 经 有 vo ov, ov 的 结果 是 4， 比 5 还 要 


小 1 个 单位 ， 它 才 是 最 短 距 离 ， 如 图 7-7-4 所 示 。 


图 7-7-4 
由 于 顶点 v5 还 与 v4。、vVs 连 线 ， 所 以 此 时 我 们 同时 求 得 了 vo νο vy 


其 实 束 是 Vo ον νο >V4=4+1=5, Vo νο PV 5 =4t+7=11 ° 这 里 v0 
V2 我 们 用 的 是 刚才 计算 出 来 的 较 小 的 4°。 此 时 我 们 也 发 现 y o ον ι ον 
2 了 V4=5 要 比 Vvo >v; V4=6 还 要 小 。 所 以 v0 到 vi 目前 的 最 小 距离 是 
5， 如 图 7-7-5 所 示 。 


图 7-7-5 

当 我 们 要 求 vo 到 vs 的 最 短 距 离 时 ， 通 加 vs 的 三 条 边 ， 除 了 ve 没有 人 研 
RII, Vg ον 了 V3 的 结果 是 8， 而 Vo ον va=5+2=7。 因 此 ，vn 
到 v ,的 最 短 距离 是 7， 如 图 7-7-6 所 示 。 


图 7-7-6 


好 了 ， 我 想 你 大 致 明白 ， 这 个 迪 杰 斯 特 拉 (Di-jkstra) 算法 是 如 何 干 活 
的 了 。 它 并 不 是 一 下 子 就 求 出 了 v0 到 vg 的 最 短路 径 ， 而 是 一 步 步 求 出 
它们 之 间 顶 点 的 最 短路 径 ， 过 程 中 都 是 基于 已 经 求 出 的 最 短路 径 的 基 
础 上 ， 求 得 更 远 顶 点 的 最 短路 径 ， 最 终 得 到 你 要 的 结果 。 


如 果 还 是 不 太 明 白 ， 不 要 紧 ， 现 在 我 们 来 看 代码 ， 从 代码 的 模拟 运行 
中 ， 再 次 去 理解 它 的 思想 。 


#define MAXVEX 9 
#define INFINITY 65535 


typedef int 


/* 用 于 存储 最 短路 径 下 标的 数组 */ 


Patharc[MAXVEX]; 


typedef int 


/* 用 于 存储 到 各 点 最 短路 径 的 权 值 和 */ 


ShortPathTable[MAXVEX] ; 


/* Dijkstra 算 法 ， 求 有 向 网 6 的 v 9 顶点 到 其 余 顶 点 v 最 短路 径 P[v] 及 带 权 长 度 D[V] */ 


/* P[v] 的 值 为 前 驱 顶 点 下 标 ，D[v] 表 示 v ϱ 到 v 的 最 短路 径 长 度 和 。 */ 
void ShortestPath_Dijkstra(MGraph G, int νο, 


Patharc *P, ShortPathTable *D) 


int v, w, k, min; 


/* final[w]=1 表 示 求 得 顶点 v ϱ Zv w 的 最 短路 径 */ 


int final[MAXVEX]; 


/* 初始 化 数据 */ 
for (v = 0; v < G.numVertexes; v++) 
fi 
/全 部 顶点 初始 化 为 未 知 最 短路 径 状 态 */ 


final[v] = 


/* 将 与 v @ 点 有 连 线 的 顶点 加 上 权 值 */ 


(*D)[v] = G.arc[vo][v]; 
/* 初始 化 路 径 数 组 P 为 -1 */ 
全 下 


/* v o 至 v ϱ 路径 为 9 */ 


ας ο 


/* V o BV 0 不 需要 求 路 径 */ 


final[v9] = 1; 


/* 开始 主 循环 ， 每 次 求 得 v 9 到 某 个 v 顶 点 的 最 短路 径 */ 


for (v = 1; v < G.numVertexes; v++) 


{ 


/* 当前 所 知 离 v ϱ 顶点 的 最 近 距 离 */ 


min=INFINITY; 


/* IRAV 0 最 近 的 顶点 */ 


for (w = 0; w < G.numVertexes; w++) 


{ 
if (!final[w] && (*D)[w] < min) 
q 
k=w; 
/* WwW 顶点 离 v 9 顶点 更 近 */ 
min = (*D)[w]; 
} 


/* 将 目前 找到 的 最 近 的 顶点 置 为 1 */ 


final[k] = 1; 


/* 修正 当前 最 短路 径 及 距离 */ 


for (w = 0; w < G.numVertexes; w++) 


η 
/* 如 果 经 过 v 顶 点 的 路 径 比 现在 这 条 路 径 的 长 度 短 的 话 */ 


if ('final[w] 88 (min + G.arc[k][w] < (*D)[w])) 


{ 


/* 说 明 找 到 了 更 短 的 路 径 ， 修 改 D[w] 和 P[w] */ 


/* 修改 当前 路 径 长 度 */ 


(*D)[w] = min + G.arc[k][w]; 


(*P) [w]=k; 


} 


调用 此 画 数 前 ， 其 实 我 们 需要 为 图 7-7-7 的 左 图 准备 邻接 矩阵 MGraph 的 
G， 如 图 7-7-7 的 右 图 ， 并 且 定 义 参 数 v 0 为 0。 
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图 7-7-7 


1. 程序 开始 运行 ， 第 4 行 final 数 组 是 为 了 vo 到 某 顶 点 是 否 已 经 求 得 最 
短路 径 的 标记 ， 如 果 v0 到 v 已 经 有 结果 ， 则 fi-nal[w]=1。 


2. 第 5~~10 行 ， 是 在 对 数据 进行 初始 化 的 工作 。 此 时 final 数 组 值 均 为 
0， 表 示 所 有 的 点 都 未 求 得 最 短路 径 。D 数 组 为 
{65535,1,5,65535,65535,65535,65535,65535,65535} 5 AlAv, Sv, Mv, 
的 边 权 值 为 1 和 5。 了 数组 全 为 0， 表 示 目 前 没有 路 径 。 


3. 第 11 行 ， 表示 vo 到 v0 目 喘 ， 权 值 和 结果 为 0。 D 数 组 为 
{0,1,5,65535,65535,65535,65535,65535,65535}。 第 12 行 ， 表 示 v0 点 算是 
已 经 求 得 最 短路 径 ， 因 此 final[0]=1。 此 时 final 数 组 为 
{1,0,0,0,0,0,0,0,0}。 些 时 整个 初始 化 工作 完成 。 


4. 第 13~33 行 ， 为 主 循环 ， 每 次 循环 求 得 vo 与 一 个 顶点 的 最 短路 径 。 
因此 v 从 1 而 不 是 0 开始 。 


5. 第 15~23 行 ， 先 令 min 为 65535 的 极 大 值 ， 通 过 w 循 环 ， 与 D[w] 比 较 
找到 最 小 值 min=1，k=1。 


6. 第 24 行 ， 由 k=1， 表 示 与 v6 最近 的 顶点 是 v1 ， 并 且 由 D[1]=1， 知 道 
此 时 v0 到 v | 的 最 短 距 离 是 1° 因此 将 vj 对 应 的 final[1] 设 置 为 1°。 此 时 
final 数 组 为 {1,1,0,0,0,0,0,0,0}。 


7. 第 25~32 行 是 一 循环 ， 此 循环 甚 为 关键 。 它 的 目的 是 在 刚才 已 经 找 
ἕν o ἕν 的 最 短路 径 的 基础 上 ， 对 v1 与 其 他 顶点 的 边 进行 计算 ， 得 到 
v0 与 它们 的 当前 最 短 距离 ， 如 图 7-7-8 所 示 。 因 为 min=1， 所 以 本 来 
D[2]=5， 现 在 vo νι >v =D[2]=mint3=4, Vo 一 V1 了 V3 
=D[3]=min+7=8, vo >v; ”~v4=D[4]=min+5=6， 因 此 ，D 数 组 当前 值 为 
{0,1,4,8,6,65535,65535,65535,65535}。 而 P[2]=1，P[3]=1，P[4]=1， 它 表 
示 的 意思 是 vo 到 v，。、vV3、V4 扩 的 最 短路 径 它们 的 前 驱 均 是 v1 » ΠΕΡ 
数组 值 为 ，{0,0,1,1,1,0,0,0,0}。 
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图 7-7-8 


8. 重新 开始 循环 ， 此 时 v=2。 第 15~23 行 ， 对 w 循 环 ， 注 意 因为 
final[0]=1 和 fi-nal[1]=1， 由 第 18 行 的 !final[w] 可 知 ，v0 Sv, 并 不 参与 最 
小 值 的 获取 。 通 过 循环 比较 ， 找 到 最 小 值 min=4，k=2。 

9, 第 24 行 ， 由 k=2， 表 示 已 经 求 出 v0 到 v ,的 最 短路 径 ， 并 且 由 


D[2]=4， 知 道 最 短 距 离 是 4°。 因此 将 v ,对 应 的 final[2] 设 置 为 1， 此 时 
final 数 组 为 ，{1,1,1,0,0,0,0,0,0}。10. 第 25~32 行 。 在 刚才 已 经 找到 v 


Εν» 的 最 短路 径 的 基础 上 ， 对 v，, 与 其 他 顶点 的 边 ， 进 行 计 算 ， 得 到 v 。 
与 它们 的 当前 最 短 距 离 ， 如 图 7-7-9 所 示 。 因 为 min=4， 所 以 本 来 
D[4]=6， 现 在 vo >v» 一 V4 =D[4]=min+1=5, Vo >V» ονς 
=D[5]=min+7=11， 因 此 ，D 数 组 当前 值 为 : 
{0,1,4,8,5,11,65535,65535,65535}。 而 原本 P[4]=1， 此 时 P[4]=2， 

P[5]=2， 它 表示 v6 ἕν ` vs 点 的 最 短路 径 它 们 的 前 驱 均 是 v，。。 此 时 P 


数组 值 为 : {0,0,1,1,2,2,0,0,0} 5 


图 7-7-9 


11. 重新 开始 循环 ， 此 时 v=3。 第 15~23 行 ， 通 过 对 w 循 环比 较 找 到 最 
/MĒmin=5, k=4 ° 12. 第 24 行 ， 由 k=4， 表 示 已 经 求 出 vv 到 v ,的 最 短 
路 径 ， 并 且 由 D[4]=5， 知 道 最 短 距离 是 s。 因 此 将 v4 对 应 的 final[4] 设 置 
为 1。 此 时 final 数 组 为 : {1,1,1,0,1,0,0,0,0} ° 13. 825~3274T ° Mv 5 
其 他 顶点 的 边 进行 计算 ， 得 到 vo 与 它们 的 当前 最 短 距 离 ， 如 图 7-7-10 
所 示 。 因 为 min=5， 所 以 本 来 D[3]=8， 现 在 vo ον ον. 
=D[3]=min+2=7, ASED[5]=11, HEV) ον, ”~vs=D[5]=min+3=8， 另 
ghvo ον >ve=D[6]=min+6=11, vo ον >V7=D[7]=min+9=14, 
此 ，D 数 组 当前 值 为 : {0,1,4,7,5,8,11,14,65535}。 而 原本 P[3]=1， 此 时 
P[3]=4， 原 本 P[5]=2， 此 时 P[5]=4， 另 外 P[6]=4，P[7]=4， 它 表示 v0 到 v 
3 “Vs “Ve “Vy 反 的 最 短路 径 它 们 的 前 驱 均 是 v4。 此 时 P 数 组 值 为 : 
{0,0,1,4,2,4,4,4,0} 5 


图 7-7-10 


14. 之 后 的 循环 就 完全 类 似 了 。 得 到 最 终 的 结果 ， 如 图 7-7-11 所 示 。 此 
时 final 数 组 为 ，{1,1,1,1,1,1,1,1,1}， 它 表示 所 有 的 顶点 均 完成 了 最 短路 
径 的 查找 工作 。 此 时 D 数 组 为 ，{0,1,4,7,5,8,10,12,16} ， 它 表示 vo 到 各 
个 顶点 的 最 短路 径 数 ， 比 如 D[8]=1+3+1+2+3+2+4=16。 此 时 的 P 数 组 
Ἢ: {0,0,1,4,2,4,3,6,7}， 这 串 数 字 可 能 略为 难 理解 一 些 。 比 如 P[8]=7， 
它 的 意思 是 vo 到 vg 的 最 短路 径 ， 顶 点 vg 的 前 驱 顶 点 是 v; ， 再 由 P[7]=6 


表示 vy 的 前 驱 是 ve P[6]=3, X7 6 PRK ÆEv 3 5 EER AT ΕΡΜΗ, 
v0 到 vs 的 最 短路 径 为 vg -V7 Vg “να «νι «νο νι -νρ, Elva 
NV >V >V4 σενα >Vg ?V7?Vg ο 


图 7-7-11 


其 实 最 终 返回 的 数组 D 和 数组 P， 是 可 以 得 到 vu 到 任意 一 个 顶点 的 最 短 
路 径 和 路 径 长 度 的 。 例 如 v0 到 vs 的 最 短路 径 并 没有 经 过 vs。 ， 但 我 们 已 
经 知道 vv 到 v 。 的 最 短路 径 了 。 由 D[5]=8 可 知 它 的 路 径 长 度 为 8， 由 
P[5]=4 可 知 vs 的 前 驱 顶 点 是 v4 ， 所 以 vo 到 vs 的 最 短路 径 是 vo νιν 
A AE ONS: 


Hiatt, RNEER (Dijkstra) 算法 解决 了 从 某 个 源 点 到 
其 余 各 顶点 的 最 短路 径 问 题 。 从 循环 和 嵌 套 可 以 很 容易 得 到 此 算法 的 时 
间 复 杂 度 为 Do “)， 尽 管 有 同学 觉得 ， 可 不 可 以 只 找到 从 源 点 到 某 一 个 
特定 终点 的 最 短路 径 ， 其 实 这 个 问题 和 求 源 点 到 其 他 所 有 顶点 的 最 短 
路 径 一 样 复杂 ， 时 间 复 杂 度 依然 是 O(n?)。 


这 职 好 比 ， 你 号 了 七 个 包子 终于 算是 吃 色 了 ， 吏 感觉 很 不 划算 ， 前 六 
个 包子 日 吃 了 ， 应 该 直接 吃 第 七 个 包子 ， 于 是 你 束 去 寻找 可 以 用 一 个 
下 能 饱 肚 子 的 包 了 于 ， 能 够 满足 你 的 要 求 最 终结 来 只 能 有 一 个 ， 那 束 是 
用 七 个 包子 的 面粉 和 饮 做 的 一 个 大 包子 。 这 种 只 关注 结 末 而 忽略 过 程 
的 思想 是 非常 不 可 取 的 。 


可 如 果 我 们 还 需要 知道 如 vs 到 vs、v1 到 vy 这 样 的 任 一 顶点 到 其 余 所 

有 顶点 的 最 短路 径 怎 么 办 呢 ? 此 时 简单 的 办 法 就 是 对 每 个 顶点 当 作 源 

点 运行 一 次 迪 杰 斯 特 拉 (Dijkstra) 算法 ， 等 于 在 原 有 算法 的 基础 上 ， 

再 来 一 次 循环 ， 此 时 整个 算法 的 时 间 复 杂 度 就 成 了 On3)。 

对 此 ， 我 们 现在 再 来 介绍 另 一 个 求 最 短路 径 的 算法 一 一 弗 阁 伊 德 
(Floyd) ， 它 求 所 有 顶点 到 所 有 顶点 的 时 间 复 杂 度 也 是 O(n”)， 但 其 

算法 非 第 简 涪 优雅 ， 能 让 人 感觉 到 知 莫 的 无 限 魅 力 。 好 了 ， 让 我 们 下 
同 来 欣赏 和 学 习 它 吧 9 


7.7.2 PHPH (Floyd) 算法 


为 了 能 讲 明 白 弗 洛 伊 德 (Floyd) 算法 的 精妙 所 在 ， 我 们 先 来 看 最 简单 
的 案例 。 图 7-7-12 的 左 图 十 一 个 最 简单 的 3 个 顶 扩 连通 网 图 。 
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图 7-7-12 


我 们 先 定义 两 个 二 维 数组 D[3][3] 和 P[3][3]，D 代 表 顶 点 到 顶点 的 最 短路 
径 权 值 和 的 矩阵 。P 代 表 对 应 顶点 的 最 小 路 径 的 前 驱 矩 阵 ， 用 来 存储 路 
径 。 在 未 分 析 任 何 顶点 之 前 ， 我 们 将 D 命 名 为 D .1 ， 其 实 它 就 是 初始 的 
图 的 邻接 矩阵 。 将 P 命 名 为 P.; ， 初 始 化 为 图 中 所 示 的 矩阵 ο 


首先 我 们 来 分 析 ， 所 有 的 顶点 经 过 v 0 后 到 达 另 一 顶点 的 最 短路 径 。 
为 只 有 三 个 顶点 ， 因 此 需要 查看 v ; -vo ”~v，。， 得 到 D | [1][0]+D | [0] 
[2]=2+1=3 ° D .i [1[2] 表 示 的 是 vi >v 的 权 值 为 5， 我 们 发 现 D ; [1] 

[2]>D ; [1[0]+D | [0][2]， 通 俗 的 话 讲 束 是 v1 ον, >v Mav, >v, 


距离 还 要 近 。 所 以 我 们 就 让 D .1 [1][2]=D _, [1]J[0]+D _, [0][2]=3， 同 样 的 
D [2][1]=3， 于 是 就 有 了 Do 的 矩阵。 因为 有 变化 ， 所 以 P 和 矩阵 对 应 的 P 
a [1][2J 和 Pi [2][1] 也 修改 为 当前 中 转 的 顶点 vo 的 下 标 0， 于 是 束 有 了 P 
ο 5 也 就 是 说 Do [v][w]=min{D | [v][w],D _, [vJ[0]+D _, [0][w]} 


接 下 来 ， 其 实 也 或 是 在 Do 和 Po 的 基础 上 继续 处 理 所 有 顶点 经 过 Vv | 和 v 

> 后 到 达 另 一 顶点 的 最 短路 径 ， 得 到 Di; MP] > D ,和 P ,完成 所 有 顶点 

到 所 有 顶点 的 最 短路 径 计算 工作 。 

如 采 我 融 用 这 人 么 简单 的 图 形 来 讲解 代码 ， 大 和 家 一 定 会 觉得 不 能 说 明 什 

ο ο 面 的 复杂 网 图 为 例 ， 来 讲解 弗 洛 伊 德 
Floyd) 算法 。 


百 先 我 们 针对 图 7-7-13 的 左 网 图 准备 两 个 矩阵 D ; 和 P_; ，D EMA 
的 邻接 矩阵 ，P .1 初 设 为 P 身 中 =j 这 样 的 矩阵 ， 它 主要 用 来 存储 路 径 。 
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图 7-7-13 


代码 如 下 ， 注 意 因 为 是 求 所 有 顶点 到 所 有 顶点 的 最 短路 径 ， 因 此 
Pathmatirxz 和 ShortPathTable 都 是 二 维 数组 。 


typedef int Pathmatirx[MAXVEX] [MAXVEX]; 


typedef int ShortPathTable[MAXVEX] [MAXVEX]; 


/* Floyd 算 法 ， 求 网 图 6 中 各 顶点 v 到 其 余 顶 点 w 最 短 


路 径 P[v] [w] 及 带 权 长 度 D[v] [w] */ 


void ShortestPath_Floyd(MGraph G, Pathmatirx *P, 


ShortPathTable *D) 


int v, w, k; 
7* ΙΑΗΡΗΡ */ 
for (v = 0; v < G.numVertexes; ++v) 


for (w = 0; w < G.numVertexes; ++w) 


{ 
/* D[v][w] 值 即 为 对 应 点 间 的 权 值 */ 
(*D)[v][w] = G.matirx[v][w]; 
/* 初始 化 P */ 
(*P)[v][w] = w; 
} 
} 
for (k = 0; k < G.numVertexes; ++k) 
{ 


for (v = 0; v < G.numvertexes; ++v) 
{ 
for (w = 0; w < G.numVertexes; ++w) 
{ 
if ((*D)[v][w] > (*D)[v][k] + (*D)[k][w]) 
{ 


/* 如 果 经 过 下 标 为 k 顶 点 路 径 比 原 两 点 间 路 径 更 短 */ 


/* 将 当前 两 点 间 权 值 设 为 更 小 的 一 个 */ 
(*D)[v][w] = (*D)[v][k] + (*D)[k][w]; 
/* 路 径 设置 经 过 下 标 为 k 的 顶点 */ 


GEV EA (RA 


1. 程序 开始 运行 ， 第 4 一 11 行 就 是 初始 化 了 D 和 P， 使 得 它们 成 为 图 7- 
7-13 的 两 个 矩阵 。 从 矩阵 也 得 到 ，v 0 ον | 路 径 权 值 是 1，vu ->v AE 
权 值 是 5，vo 一 v3 无 边 连 线 ， 所 以 路 径 权 值 为 极 大 值 65535。 


2. 第 12~25 行 ， 十 算法 的 主 循 环 ， 一 共 二 层 肉 侠 ，k 代 表 的 就 古 中 转 
顶点 的 下 标 。v 代 表 起 始 顶 点 ，w 代 表 结 束 顶点 。 


3. 当 K=0 时 ， 也 就 是 所 有 的 顶点 都 经 过 vo 中 转 ， 计 算是 否 有 了 最 短路 径 
的 变化 。 可 异 结 末 是 ， 没 有 任何 变化 ， 如 图 7-7-14 所 示 。 
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Ε7-7-14 


4. 当 K=1 时 ， 也 就 是 所 有 的 顶点 都 经 过 v ι 中 转 。 此 时 ， 当 v=0 时 ， 原 
本 D[0][2]=5， 现 在 由 于 D[0]J[1]+D[1][2]=4。 因 此 由 代码 的 第 20 行 ， 二 者 
取 其 最 小 值 ， 得 到 D[0][2]=4， 辣 理 可 得 D[0][3]= 8 ` D[O][4]=6, 4 
v=2、3、4 时 ， 也 修改 了 一 些 数 据 ， 请 参考 如 图 7-7-15 左 图 中 虚线 框 数 
据 。 由 于 这 些 最 小 权 值 的 修正 ， 所 以 在 路 径 和 矩阵 P 上 ， 也 要 作 处 理 ， 将 
它们 都 改 为 当前 的 P[Vv][KJ] 值 ， 见 代码 第 21 行 。 
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图 7-7-15 


5. 接 下 来 就 是 k=2 一 直到 8 结束 ， 表 示 针 对 每 个 顶点 做 中 转 得 到 的 计算 
结果 ， 当 然 ， 我 们 也 要 清楚 ，D ,是 以 D 1 为 基础 ，D ; 是 以 D Az 
础 ，...…...，Dg 是 以 D ;为 基础 ， 就 像 我 们 曾经 说 过 的 七 个 包子 的 故 
事 ， 它 们 是 有 联系 的 ， 路 径 矩 阵 P 也 是 如 此 。 最 终 当 k=8 时 ， 两 矩阵 数 
据 如 图 7-7-16 所 示 。 
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图 7-7-16 


至 此 ， 我 们 的 最 短路 人 径 就 算是 完成 了 ， 你 可 以 看 到 和 矩阵 第 v6 行 的 数值 
与 迪 术 斯 特 拉 (Dijkstra) 算法 求 得 的 D 数 组 的 数值 是 完全 相同 ， 都 是 
{0,1,4,7,5,8,10,12,16}。 而 且 这 里 是 所 有 顶点 到 所 有 顶点 的 最 短路 径 权 
值 和 都 可 以 计算 出 。 


那么 如 何 由 P 这 个 路 径 数 组 得 出 具体 的 最 短路 径 呢 ?以 vo 到 vg 为 例 ， 

从 图 7-7-16 的 右 图 第 vs 列 ，P[0][8]=1， 得 到 要 经 过 顶点 v ; ， 然 后 将 1 取 
代 0 得 到 P[1][8]=2， 说 明 要 经 过 v，， 然 后 将 2 取代 1 得 到 P[2][8]=4， 说 明 
要 经 过 V4， 然后 将 4 取代 2 得 到 P[4][8]=3， 说 明 要 经 过 v 。 ，.…...， 这 样 
很 容易 就 推导 出 最 终 的 最 短路 径 值 为 v >V] -ν» ον να V6 νο 
>Vg o 


求 最 短路 径 的 显示 代码 可 以 这 样 写 。 


for (v = 0; v < G.numVertexes; ++v) 


at 
for (w =v + 1; w < G.numVertexes; w++) 
{ 
printf("v%d-v%d weight: %d ", v, w, D[v][w]); 


/* 获得 第 一 个 路 径 顶点 下 标 */ 


eel AN Ed 
/* 打印 源 点 */ 


princie pachi xda NV) 


/* 如 果 路 径 顶点 下 标 不 是 终点 */ 
while (k != w) 
{ 

/* 打印 路 径 顶点 */ 


printf(" -> %d", Κ); 


/* 获得 下 一 个 路 径 顶点 下 标 */ 


κ = P[k] [w]; 
} 
/* FTA */ 
printf(" -> %d\n", w); 
} 
PRETEK ND) 


再 次 回 过 头 来 看 看 弗 洛 伊 德 (Floyd) 算法 ， 它 的 代码 简洁 到 就 是 一 个 
二 重 循环 初始 化 加 一 个 三 重 循环 权 值 修正 ， 融 完成 了 所 有 顶点 到 所 有 
顶点 的 最 短路 径 计算 。 几 乎 融 如 同 是 我 们 在 学 习 C 语 言 循环 代 套 的 样 例 
代码 而 已 。 如 此 简单 的 实现 ， 真 是 巧妙 之 极 ， 在 我 看 来 ， 这 有 是 非常 漂 
ARIA, DADE LEG EK? 很 可 惜 由 于 它 的 三 重 循 环 ， 因 此 也 
征 Oo3) 时 间 复 杂 度 。 如 采 你 面临 需要 求 所 有 顶点 至 所 有 顶点 的 最 短路 
Ela, FRSA (Floyd) 算法 应 该 是 不 错 的 选择 。 


另外 ， 我 们 虽然 对 求 最 短路 径 的 两 个 算法 举例 都 是 无 问 图 ， 但 它们 对 
有 问 图 依然 有 效 ， 因 为 二 者 的 蕾 异 仅仅 是 邻接 矩阵 十 否 对 称 而 已 。 


7.8 ”拓扑 排序 


说 了 两 个 有 环 的 图 应 用 ， 现 在 我 们 来 谈 谈 无 环 的 图 应 用 。 无 环 ， 即 是 
图 中 没有 回路 的 意思 。 


7.8.1 拓扑 排序 介绍 


我 们 会 把 施工 过 程 、 生 产 流程 、 软 件 开 发 、 教 学 安排 等 都 当成 一 个 项 
目 工 程 来 对 每 ， 所 有 的 工程 都 可 分 为 大 干 个 “活动 * 的 于 工程 。 例 如 图 7- 
8-1 是 我 这 非 专 业 人 士 绘 制 的 一 张 电影 制作 流程 图 ， 现 实 中 可 能 并 不 完 
全 相同 ， 但 基本 表达 了 一 个 工程 和 者 干 个 活动 的 概念 。 在 这 些 活动 之 
间 ， 通 第 会 受到 一 定 的 条 件 约束 ， 如 其 中 某 些 活 动 必 须 在 为 一 些 活动 
完成 之 后 才能 开始 。 束 像 电 影 制作 不 可 能 在 人 员 到 位 进 往 场地 时 ， 导 
演 还 没有 找到 ， 也 不 可 能 在 拍摄 过 程 中 ， 场 地 都 没有 。 这 都 会 导致 范 
恋 的 结 有 末 。 因 此 这 样 的 工程 图 ， 一 定 是 无 环 的 有 回 图 。 


在 一 个 表示 工程 的 有 癌 图 中 ， 用 顶点 表示 活动 ， 用 弧 表 示 活 动 之 间 的 
优先 天 系 ， 这 样 的 有 癌 图 为 顶点 表示 活动 的 网 ， 我 们 称 为 AOV 网 

(ActivityOn Vertex Network) 。AOV 网 中 的 弧 表 示 活 动 之 间 存 在 的 某 
种 制约 天 系 。 比 如 演 职 人 员 确 定 了 ， 场 地 也 联系 好 了 ， 才 可 以 开始 进 
场 招 摄 。 男 外 就 是 AOV 网 中 不 能 存在 回路 。 刚 才 已 经 举 了 例子 ， 让 某 
个 活动 的 开始 要 以 目 己 完成 作为 先决 条 件 ， 显 然 是 不 可 以 的 。 
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图 7-8-1 
设 G=(VE) 是 一 个 具有 n 个 顶点 的 有 向 图 ，V 中 的 顶点 序列 vi və 


vao Tia DUA flv 有 一 条 路 径 ， 则 在 顶点 序列 中 顶点 
vi 必 在 顶点 vj 之 前 。 则 我 们 称 这 样 的 顶点 序列 为 一 个 拓扑 序列 。 


图 7-8-1 这 样 的 AOV 网 的 拓扑 序列 不 止 一 条 。 序 列 vovivavav4vsv6vV 
ΝΑΝΟΝΊΟΝΗΝΥΙ2ΝΙΝΙ4ΝΙΕΝΙΡ ΖΕ ROS, MvoViV4V3VoV7 
VeVsVgVinVoV pV iV 14 13 Vis V 16 tee REN) R 


所 谓 拓 扑 排 序 ， 其 实 就 是 对 一 个 有 向 图 构造 拓扑 序列 的 过 程 。 构 造 时 
会 有 两 个 结果 ， 如 果 此 网 的 全 部 顶点 都 被 输出 ， 则 说 明 它 是 不 存在 环 
(回路 ) 的 AOV 网 ， 如 果 输 出 顶点 数 少 了 ， 哪 人 是 少 了 一 个 ， 也 说 明 
这 个 网 存在 环 (回路 ) ， 不 是 AOV 网 。 


一 个 不 存在 回路 的 AOV 网 ， 我 们 可 以 将 它 应 用 在 各 种 各 样 的 工程 或 项 
目的 流程 图 中 ， 满 足 各 种 应 用 场景 的 需要 ， 所 以 实现 拓扑 排序 的 算法 
束 很 有 价值 了 。 


7.8.2 ”拓扑 排序 算法 


对 AOV 网 进行 拓扑 排序 的 基本 思路 是 : 从 AOV 网 中 选择 一 个 入 度 为 0 的 
顶点 输出 ， 然 后 删 去 此 顶点 ， 并 删除 以 此 顶点 为 尾 的 弧 ， 继 续 重 复 此 
步骤 ， 直 到 输出 全 部 顶点 或 者 AOV 网 中 不 存在 入 度 为 0 的 顶点 为 止 。 


首先 我 们 需要 确定 一 下 这 个 图 需要 使 用 的 数据 结构 。 前 面 求 最 小 生成 
树 和 最 短路 径 时 ， 我 们 用 的 都 是 邻接 矩阵 ， 但 由 于 拓扑 排序 的 过 程 
中 ， 需 要 删除 顶点 ， 显 然 用 邻接 表 会 更 加 方便 。 因 此 我 们 需要 为 AOV 
网 建立 一 个 邻接 表 。 考 虑 到 算法 过 程 中 始终 要 查找 入 度 为 0 的 顶点 ， 我 
们 在 原来 顶点 表 结 点 结构 中 ， 增 加 一 个 入 度 域 mm， 结构 如 表 7-8-1 所 
示 ， 其 中 im 束 是 入 度 的 数 子 。 


7-8-1 


indata first edge 


因此 对 于 图 7-8-2 的 第 一 幅 图 AOV 网 ， 我 们 可 以 得 到 如 第 二 幅 图 的 邻接 
表 数 据 结构 。 
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图 7-8-2 
在 拓扑 排序 算法 中 ， 涉 及 的 结构 代码 如 下 。 


/* 边 表 结 点 */ 
typedef struct EdgeNode 
τ 
/* 邻接 点 域 ， 存 储 该 顶点 对 应 的 下 标 3/ 


int adjvex; 


Le J 存储 权 值 ， 对 于 非 网 图 可 以 不 需要 */ 


int weight; 
/* 链 域 ， 指 向 下 一 个 邻接 点 */ 
struct EdgeNode *next; 


} EdgeNode; 


/* 顶点 表 结 点 */ 
typedef struct VertexNode 
/* 顶点 入 度 */ 


hil 


/* 顶点 域 ， 存储 顶点 信息 */ 


int data; 


A os (es eee A 

EdgeNode *firstedge; 
} VertexNode, AdjList [MAXVEX]; 
typedef struct 


4 


AdjList adjList; 


/* 图 中 当前 顶点 数 和 边 数 */ 


int numVertexes, numEdges; 


} graphAdjList, *GraphAdjList; 


在 算法 中 ， 我 还 需要 辅助 的 数据 结构 一 栈 ， 用 来 存储 处 理 过 程 中 入 度 
人 
度 为 0 的 项 点 。 


现在 我 们 来 看 代码 ， 并 且 模 拟 运行 它 。 


/* 拓扑 排序 ， 若 GL 无 回路 ， 则 输出 拓扑 排序 序列 


返回 OK， 若 有 回路 返回 ERROR */ 


Status TopologicalSort(GraphAdjList GL) 


& 
EdgeNode *e; 


int i, κ, gettop; 


/* el Pin */ 


int top = 0; 


/* 用 于 统计 输出 顶点 的 个 数 */ 


ine count- ον 


/* 建 栈 存储 入 度 为 6 的 顶点 */ 
int *stack; 
stack = (int *)malloc(GL->numVertexes * sizeof(int)); 
for (i = 0; i < GL->numVertexes; i++) 
if (GL->adjList[i].in == 0) 
/* 将 入 度 为 6 的 顶点 入 栈 */ 
stack[++top] = i; 
while (top != 0) 


{ 


ET Ba 

gettop = stack[top--]; 

/* 打印 此 顶点 */ 

printf("%d -> ", GL->adjList[gettop].data); 


/* 统计 输出 顶点 数 */ 


count++; 


/* 对 此 顶点 弧 表 遍历 */ 


for (e = GL->adjList[gettop].firstedge; e; e = e->next) 
{ 
k = e->adjvex; 


/* 将 k 号 顶点 邻接 点 的 入 度 减 1 3/ 


if (!(--GL->adjList[k].in)) 


FEROA, DMEF PT UTE */ 


stack[++top] = k; 


} 


/x* 如 果 count 小 于 顶点 数 ， 说 明 存 在 环 */ 


if (count < GL->numVertexes) 
return ERROR; 
else 


return OK; 


1. 程序 开始 运行 ， 第 3 一 7 行 都 是 变量 的 定义 ， 其 中 stack 是 一 个 栈 ， 用 
来 存储 整 型 的 数字 。 


2， 第 8~10 行 ， 作 了 一 个 循环 判断 ， 把 入 度 为 0 的 顶点 下 标 都 入 栈 ， 从 
图 7-8-3 的 右 图 邻接 表 可 知 ， 此 时 stack 应 该 为 : {0,1,3},， 即 vo “νι να 
的 顶点 入 度 为 0， 如 图 7-8-3 所 示 。 


图 7-8-3 

3. 第 12~~23 行 ，while 循 环 ， 当 栈 中 有 数据 元 素 时 ， 始 终 循环 。 

4. 14~1677, v 出 栈 得 到 gettop=3。 并 打印 此 顶点 ， 然 后 count 加 

1 ο 

5. 第 17~22 行 ， 循 环 其 实 是 对 vs TROT VRE et TA, RA- 
8-4 中 的 灰色 部 分 ， 找 到 v ;连接 的 两 个 顶点 v, 和 v13 ， 并 将 它们 的 入 度 
减少 一 位 ， 此 时 v ;和 v1 的 in 值 都 为 1° 它 的 目的 是 为 了 将 v3 顶点 上 的 
弧 删 除 。 


ΠΤ 


图 7-8-4 

6. 再 次 循环 ， 第 12~23 行 。 此 时 处 理 的 是 顶点 v1。 经 过 出 栈 、 打 印 、 

count=2 后 ， 我 们 对 vj 到 v，。、v4、vV8g 的 弧 进 行 了 人 遍历。 并 同样 减少 了 

它们 的 入 度数 ， 此 时 v， 入 度 为 0， 于 是 由 第 20~21 行 知 ，v， 入 栈 ， 如 

图 7-8-5 所 示 。 试 想 ， 如 果 没 有 在 顶点 表 中 加 入 in 这 个 入 度数 据 域 ，20 

ο. οσο 这 显然 是 要 消耗 时 间 的 ， 我 们 利用 空间 换 
TH] ο 


图 7-8-5 


7. 接 下 来 ， 就 是 同样 的 处 理 方式 了 。 图 7-8-6 展 示 了 vvevovavsve 
的 打印 删除 过 程 ， 后 面 还 剩 几 个 顶点 都 类 似 ， 就 不 图 示 了 。 


图 7-8-6 


8, 最 终 拓扑 排序 打印 结果 为 3->1->2->6->0->4->5->8->7->12->9->10- 
>13->11。 当 然 这 结果 并 不 是 唯一 的 一 种 拓扑 排序 方案 。 


分 析 整 个 算法 ， 对 一 个 具有 n 个 顶点 e 条 弧 的 AOV 网 来 说 ， 第 8 一 10 行 扫 
描 顶 点 表 ， 将 入 度 为 0 的 顶点 入 栈 的 时 间 复 杂 为 O(n)， 而 之 后 的 while 循 
环 中 ， 每 个 顶点 进 一 次 栈 ， 出 一 次 栈 ， 入 度 减 1 的 操作 共 执行 了 e 次 ， 
所 以 整个 算法 的 时 间 复 杂 度 为 On+e) 。 


7.9 ”关键 路 径 


拓扑 排序 主要 是 为 解决 一 个 工程 能 否 顺序 进行 的 问题 ， 但 有 时 我 们 还 
需要 解决 工程 完成 需要 的 最 短 时 间 问 题 。 比 如 说 ， 造 一 辆 汽车 ， 我 们 
需要 先 造 各 种 各 样 的 零件 、 部 件 ， 最 终 再 组 闭 成 车 ， 如 图 7-9-1 所 示 。 
这 些 零 部 件 基本 都 是 在 流水 线 上 同时 生产 的 ， 假 如 造 一 个 轮子 需要 0.5 
天 时 间 ， 造 一 个 发 动机 需要 3 天 时 间 ， 造 一 个 车 底盘 需要 2 天 时 间 ， 造 
一 个 外 壳 需 要 2 天 时 间 ， 其 他 零 部 件 时 间 需 要 2 天 ， 全 部 零 部 件 集中 到 
一 处 需要 0.5 天 ， 组 装 成 车 需要 2 天 时 间 ， 请 问 ， 在 汽车 厂 造 一 辆 车 ， 最 
短 需 要 多 少时 间 呢 ? 


图 7-9-1 


有 人 说 时 间 就 是 全 部 加 起 来 ， 这 当然 是 不 对 的 。 我 已 经 说 了 前 提 ， 这 
些 零 部 件 都 是 分 别 在 流水 线 上 同时 生产 的 ， 也 束 是 说 ， 在 生产 发 动机 
的 3 天 里 ， 可 能 已 经 生产 了 6 个 轮子 ，1.5 个 外 碗 和 1.5 个 底盘 ， 而 组 猴 
是 在 这 些 零 部 件 都 生产 好 后 才 可 以 进行 。 因 此 最 短 的 时 间 其 实 是 零 部 
件 中 生产 时 间 最 长 的 发 动机 3 天 + 集中 零 部 件 0.5 天 + 组 装 车 的 2 天 ， 一 共 
5.5 天 完成 一 辆 汽车 的 生产 。 


因此 ， 我 们 如 末 要 对 一 个 流程 图 获得 最 短 时 间 ， 束 必须 要 分 析 它 们 的 
拓扑 关系 ， 并 且 找 到 当中 最 关键 的 流程 ， 这 个 流程 的 时 间 融 是 最 短 时 


间 。 


因此 在 前 面 讲 了 AOV 网 的 基础 上 ， 我 们 来 介绍 一 个 新 的 概念 。 在 一 个 
表示 工程 的 带 权 有 向 图 中 ， 用 顶点 表示 事件 ， 用 有 向 边 表示 活动 ， 用 
边 上 的 权 值 表示 活动 的 持续 时 间 ， 这 种 有 向 图 的 边 表示 活动 的 网 ， 我 
们 称 之 为 AOE 网 (Activity On Edge Net-work) 。 我 们 把 AOE 网 中 没有 
入 边 的 顶点 称 为 始点 或 源 点 ， 没 有 出 边 的 顶点 称 为 终点 或 汇 点 。 由 于 
一 个 工程 ， 总 有 一 个 开始 ， 一 个 结束 ， 所 以 正常 情况 下 ，AOE 网 只 有 
一 个 源 点 一 个 汇 点 。 例 如 图 7-9-2 就 是 一 个 AOE 网 。 其 中 vo 即 是 源 点 ， 
表示 一 个 工程 的 开始 ，vg 是 汇 点 ， 表 示 整 个 工程 的 结束 ， 顶 点 vo γι 


) 。 Vo 分 别 表示 事件 ， M<vo,V1>, ΞΘ.) PERE <V9,Vg9 >a 
表示 一 个 活动 , 用 au αι, ....... an 表示 ， 它 们 的 值 代 表 着 活动 持 


续 的 时 间 ， 比 如 弧 <vo,vi > 就 是 从 源 点 开始 的 第 一 个 活动 a ， 它 的 时 
间 是 3 个 单位 。 


η 


图 7-9-2 


既然 AOE 网 是 表示 工程 流程 的 ， 所 以 它 整 具有 明显 的 工程 的 特性 。 如 
有 在 某 顶 点 所 代表 的 事件 发 生 后 ， 从 该 顶点 出 发 的 各 活动 才能 开始 。 


SO 


N 


有 在 进入 某 顶 点 的 各 活动 都 已 经 结束 ， 该 顶点 所 代表 的 事件 才能 发 


管 AOE 网 与 AOV 网 都 是 用 来 对 工程 建 模 的 ， 但 它们 还 是 有 很 大 的 不 
同 ， 主 要 体现 在 AOV 网 是 顶点 表示 活动 的 网 ， 它 只 揪 述 活动 之 间 的 制 
约 关 系 ， 而 AOE 网 十 用 边 表示 活动 的 网 ， 边 上 的 权 值 表示 活动 持续 的 
时 间 ， 如 图 7-9-3 所 示 两 图 的 对 比 。 因 此 ，AOE 网 是 要 建立 在 活动 之 间 
制约 关系 没有 矛盾 的 基础 之 上 ， 再 来 分 析 完 成 整个 工程 至 少 需 要 多 少 
时 间 ， 或 者 为 缩短 完成 工程 所 需 时 间 ， 应 当 加 快 哪些 活动 等 问题 。 


AE 
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我 们 把 路 径 上 各 个 活动 所 持续 的 时 间 之 和 称 为 路 径 长 度 ， 从 源 点 到 汇 
点 具有 最 大 长 度 的 路 径 叫 关 键 路 径 ， 在 关键 路 径 上 的 活动 叫 关 键 活 
动 。 显 然 束 图 7-9-3 的 AOE 网 而 言 ， 开 始 - 发 动机 完成 -部件 集中 到 位 
”组装 完 成 就 是 关键 路 径 ， 路 径 长 度 为 5.5。 


如 采 我 们 需要 缩短 整个 工期 ， 去 改进 轮子 的 生产 效率 ， 哪 怕 改 动 成 0.1 
也 是 无 益 于 整个 工期 的 变化 ， 只 有 缩短 关键 路 径 上 的 关键 活动 时 间 才 
可 以 减少 整个 工期 长 度 。 例 如 如 采 发 动机 制造 缩短 为 2.5， 整 车 组 装 缩 
短 为 1.5， 那 么 关键 路 径 长 度 就 为 4.5， 整 整 缩短 了 一 天 的 时 间 。 


那么 现在 的 问题 融 是 如 何 找 出 关键 路 径 。 对 人 来 说 ， 图 7-9-3 第 二 幅 这 
样 的 AOE 网 ， 应 该 比较 容易 得 出 关键 路 径 的 ， 而 对 于 图 7-9-2 的 AOE 
网 ， 束 相对 麻烦 一 些 ， 如 采 继 续 复杂 下 去 ， 可 能 殉 非 人 脑 该 去 做 的 事 
ye 


79.1 关键 路 径 算法 原理 


为 了 讲 清楚 求 关键 路 径 的 算法 ， 我 还 是 来 举 个 例子 。 假 设 一 个 学 生 放 
学 回 家 ， 除 掉 吃 饭 、 洗 汶 外 ， 到 睡觉 前 有 四 小 时 空 凋 ， 而 家 庭 作业 需 
要 两 小 时 完成 。 不 同 的 学 生 会 有 不 同 的 做 法 ， 抓 紧 的 学 生 ， 会 在 头 两 
小 时 束 完 成 作业 ， 然 后 看 看 电视 、 读 读 课 外 书 什么 的 ; 但 也 有 超过 一 
半 的 学 生 会 在 最 后 两 小 时 才 去 做 作业 ， 要 不 是 因为 没 时 间 ， 可 能 还 要 
再 拖延 下 去 。 下 面 的 同学 不 要 笑 ， 像 是 在 说 你 的 是 吧 ， 你 们 古 不 是 有 
过 暑假 两 个 月 ， 要 到 最 后 几 天 才 去 赶 作业 的 坏 毛病 呀 ?这 也 没什么 好 
SEA, EMEARI ° 
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330, MEABE Za EAR, AAT, Ge 
υ ee ο 显然 ， 当 最 早 和 最 晚 开 始 时 间 不 相等 时 就 
意味 着 有 空闲 。 


接 看 ， 你 老 妈 发 现 了 你 拖延 的 小 秘密 ， 于 是 天 了 很 多 的 谋 外 习题 ， 要 
求 你 四 个 小 时 ， 不 许 有 一 丝 空间 ， 省 得 你 拖延 或 偷懒 。 此 时 整个 四 小 
时 全 部 被 占 满 ， 最 早 开始 时 间 和 最 晚 开 始 时 间 都 是 9， 因 此 它 束 是 关键 


活动 了 。 
也 就 是 说 ， 我 们 只 需要 找到 所 有 活动 的 最 早 开始 时 间 和 最 晚 开 始 时 


间 ， 并 且 比较 它们 ， 如 果 相 等 就 意味 着 此 活动 是 关键 活动 ， 活 动 间 的 
路 人 径 为 天 键 路 径 。 如 果 不 等 ， 则 就 不 是 。 


为 此 ， 我 们 需要 定义 如 下 几 个 参数 。 


1. 事 件 的 最 早 发 生 时 间 etv (earliest time ofvertex) : 即 顶 点 vj 的 最 早 发 
生 时 间 。 


2. 事 件 的 最 晚 发 生 时 间 1ltv (latest time ofvertex) : 即 顶 点 v1 的 最 晚 发 生 
时 间 ， 也 就 是 每 个 顶点 对 应 的 事件 最 晚 需要 开始 的 时 间 ， 超 出 此 时 间 
将 会 延误 整个 工期 。 


3. 活 动 的 最 早 开 工时 间 ete (earliest time ofedge) : 即 弧 a 的 最 早 发 生 
时 间 。 


4. 活 动 的 最 晚 开工 时 间 lte (latest time ofedge) : 即 弧 a 的 最 晚 发 生 时 
间 ， 也 残 是 不 推 开工 期 的 最 晚 开工 时 间 。 


我 们 是 由 1 和 2 可 以 求 得 3 和 和 4， 然后 再 根据 ete[k] 是 否 与 lte[k] 相 等 来 判断 
a, 是 否 是 关键 活动 。 


7.9.2 ”关键 路 径 算法 
我 们 将 图 7-9-2 的 AOE 网 转化 为 邻接 表 结 构 如 图 7-9-4 所 示 ， 注 意 与 拓扑 


排序 时 邻接 表 结 构 不 同 的 地 方 在 于 ， 这 里 弧 链 表 增 加 了 weight 域 ， 用 来 
存储 弧 的 权 值 。 
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求 事件 的 最 早 发 生 时 间 etv 的 过 程 ， 就 是 我 们 从 头 至 尾 找 拓扑 序列 的 过 
程 ， 因 此 ， 在 求 关键 路 径 之 前 ， 需 要 先 调用 一 次 拓扑 序列 算法 的 代码 
来 计算 etv 和 拓扑 序列 列表 。 为 此 ， 我 们 首先 在 程序 开始 处 声明 几 个 全 


局 变量 。 


i /* 事件 最 早 发 生 时 间 和 最 迟 发 生 时 间 数 组 «, 


int *stack2; ee 


于 存储 拓扑 序列 的 栈 */ 


oS 


int top2; /* 用 于 stack2 的 指针 */ 


其 中 stack2 用 来 存储 拓扑 序列 ， 以 便 后 面 求 关键 路 径 时 使 用 。 
下 面 是 改进 过 的 求 拓扑 序列 算法 。 


/* 拓扑 排序 ， 用 于 关键 路 径 计算 */ 


Status TopologicalSort(GraphAdjList GL) 


{ 


EdgeNode *e; 


int i, k, gettop; 


/* APE Pin */ 


int top = 0; 


/* 用 于 统计 输出 顶点 的 个 数 */ 


ππε counte = “ον 


/* 建 栈 将 入 度 为 6 的 顶点 入 栈 */ 
int *stack; 
stack = (int *)malloc(GL->numVertexes * sizeof(int)); 
for (i = 0; i < GL->numVertexes; i++) 
if (© == GL->adjList[i].in) 
stack[++top] = i; 
/* 初始 化 为 8 */ 


top2 = ϐ; 


/* 事件 最 早 发 生 时 间 */ 


etv = (int *)malloc(GL->numVertexes * sizeof(int)); 
for (i = 0; i < GL->numVertexes; i++) 
/* ICAO */ 
etv[i] = 0; Ñ 
/* sete E 
stack2 = (int *)malloc(GL->numVertexes * sizeof(int)); 


while (top != 0) 


{ 
gettop = stack[top--]; 
count++; 
/* 将 弹出 的 顶点 序号 压 入 拓扑 序列 的 栈 */ 
stack2[++top2] = gettop; 
for (e = GL->adjList[gettop].firstedge; e; e = e->next) 
€ 
k = e->adjvex; 
if (!(--GL->adjList[k].in)) 
stack[++top] = k; 
/* 求 各 顶点 事件 最 早 发 生 时 间 值 */ 
if ((etv[gettop] + e->weight) > etv[k]) 
etv[k] = etv[gettop] + e->weight; 
} 
} 


if (count < GL->numVertexes) 
return ERROR; 
else 


return OK; 


代码 中 ， 除 加 粗 部 分 外 ， 与 前 面 讲 的 拓扑 排序 算法 没有 什么 不 同 。 


第 11~15 行 为 初始 化 全 局 变量 etv 数 组 、top2 和 stack2 的 过 程 。 第 21 行 就 
是 将 本 是 要 输出 的 拓扑 序列 压 入 全 局 栈 stack2 中 。 第 27~28 行 很 关键 ， 
它 是 求 etv 数 组 的 每 一 个 元 素 的 值 。 比 如 说 ， 假 如 我 们 已 经 求 得 顶点 v0o 
对 应 的 etv[0]=0， 顶 点 vj 对 应 的 etv[1]=3， 顶 点 v ,对 应 的 etv[2]=4， 现 在 
我 们 需要 求 顶 点 v3 对 应 的 etv[3]， 其 实 就 是 求 etv[1]+len<v 1 ,v3 > 与 
etv[2]+len<v 5 ‚v 3 > 的 较 大 值 。 显 然 3+5<4+8， 得 到 etv[3]=12， 如 图 7-9-5 
所 示 。 在 代码 中 e->weight 就 是 当前 弧 的 长 度 。 


ΡΑΕ λρ 
ή ο ο. 


ο 


图 7-9-5 


由 此 我 们 也 可 以 得 出 计算 顶点 yx 即 求 etv[k] 的 最 早 发 生 时 间 的 公式 古 : 


其 中 P[K] 表 示 所 有 a 到达 顶 点 vy 的 弧 的 集合 。 比 如 图 7-9-5 的 P[3] 束 是 <v1 
,V3> 和 <v 2.ν η > 两 条 弧 R len<vij,vk> 是 弧 <vi,vk> 上 的 权 值 is 


下 面 我 们 来 看 求 关键 路 径 的 算法 代码 。 


/* 求 关键 路 径 ，GL 为 有 向 网 ， 输 出 6L 的 各 项 关键 活动 */ 


void CriticalPath(GraphAdjList GL) 


{ 
EdgeNode *e; 


int i, gettop, K 1; 


/* 声明 活动 最 早 发 生 时 间 和 最 迟 发 生 时 间 变 量 */ 


int ete, lte; 


/* 求 拓扑 序列 ， 计 算数 组 etv 和 stack2 的 值 */ 
TopologicalSort(GL); 


/* 事件 最 晚 发 生 时 间 * / 


ilinl 
ΤΠ 
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ltv = (int *)malloc(GL->numVertexes * sizeof(int)); 
for (i = 0; i < GL->numVertexes; i++) 
/* ΒΙβί1εν */ 


ltv[i] = etv[GL->numVertexes - 1]; 


ΠΙΕΣΗ 
while (top2 != 0) 


{ 


/* 将 拓扑 序列 出 栈 ， 后 进 先 出 */ 


gettop = stack2[top2--]; 
for (e = GL->adjList[gettop].firstedge; e; e = e->next) 


{ 


/* 求 各 顶点 事件 的 最 迟 发 生 时 间 Ltv 值 */ 


k = e->adjvex; 


/* 求 各 顶点 事件 最 晚 发 生 时 间 ]tv */ 


if (ltv[k] - e->weight < ltv[gettop]) 


1tv[gettop] = ltv[k] - e->weight; 


i 


/* 求 ete，lte 和 关键 活动 */ 


for (j = 0; j < GL->numVertexes; j++) 

ή 
for (e = GL->adjList[j].firstedge; e; e = e->next) 
{ 


k = e->adjvex; 


/* 活动 最 早 发 生 时 间 */ 


ete = etv[j]; 


/* 活动 最 迟 发 生 时 间 */ 


lte = ltv[k] - e->weight; 


* 两 者 相等 即 在 关键 路 径 上 */ 


if (ete == lte) 7 
printf("<v%d,v%d> length: %d , ", 


GL->adjList[j].data, GL->adjList[k].data, e->weight); 


1. 程序 开始 执行 。 第 5 行 ， 声 明了 ete 和 lte 两 个 活动 最 早 最 晚 发 生 时 间 


2， 第 6 行 ， 调 用 求 拓扑 序列 的 画 数 。 执 行 完毕 后 ， 全 局 变量 数组 etv 和 
栈 stack 的 值 如 图 7-9-6 所 示 ，top2=10。 也 就 是 说 ， 对 于 每 个 事件 的 最 早 
发 生 时 间 ， 我 们 已 经 计算 出 来 了 。 


0 | 2 3 4 § 6 7 8 9 
o PEE ee 
onnan 


οὐ! 


图 7-9-6 


3. 第 7~-9 行 为 初始 化 全 局 变量 ltv 数 组 ， 因 为 etv[9]=27， 所 以 数组 ltv 当 
前 的 值 为 2 {27,27,27,27,27,27,27,27,27,27} 


4， 第 10~19 行 为 计算 ltv 的 循环 。 第 12 行 ， 先 将 stack2 的 栈 头 出 栈 ， 由 
后 进 移 出 得 到 gettop=9。 根 据 邻 接 表 中 ，ve 没 有 弧 表 ， 所 以 第 13 一 18 行 
循环 体 未 执行 。 

5， 再 次 来 到 第 12 行 ，gettop=8， 在 第 13~18 行 的 循环 中 ，vs AMR 
有 一 条 <vg,vo>， 第 15 行 得 到 k=9， 因 为 ltv[9]-3<ltv[8]， 所 以 
ltv[8]=ltv[9]-3=24， 如 图 7-9-7 所 示 。 


ο ΠΜ. 


图 7-9-7 


6. 再 次 循环 ， 当 gettop=7、5、6 时 ， 同 理 可 算出 ltv 相 对 应 的 值 为 19、 
135.35. ΠΕΜ. 427: 27,27) 2 45. 25, 19, δη. πι 


7. 当 gettop=4 时 ， 由 邻接 表 可 得 到 v4 AMA <vy.ve> «νι ν72. 
通过 第 13~18 行 的 循环 ， 可 以 得 到 ltv[4]=min(ltv[7]-4,ltv[6]-9)=min(19- 
4,25-9)=15， 如 图 7-9-8 所 示 。 


ΑΣ 
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图 7-9-8 


此 时 你 应 该 发 现 ， 我 们 在 计算 ltv 时 ， 其 实 是 把 拓扑 序列 倒 过 来 进行 
的 。 因 此 我 们 可 以 得 出 计算 顶点 vk 即 求 ltv[k] 的 最 晚 发 生 时 间 的 公式 
JE: 


atv kh 当时 


ΙΙ |= 
i | min{In{j]-len <v” >}, Aken <v, >= St 


其 中 S[K] 表 示 所 有 从 顶点 vy 出 发 的 弧 的 集合 。 比 如 图 7-9-8 的 S[4] 就 是 
<V4sV6> 和 <v 4 ,Vzy> 两 条 弧 ，en<v gV; e Vj> 上 的 权 值 。 


就 这 样 ， 当 程序 执行 到 第 20 行 和 时， 相关 变量 的 值 如 图 7-9-9 所 示 ， 比 如 
etv[1]=3 而 ltv[1]=7， 表 示 的 意思 就 是 如 果 时 间 单 位 是 天 的 话 ， 哪 怕 v1 
这 个 事件 在 第 7 天 才 开 始 ， 也 可 以 人 证 整个 工程 的 按期 完成 ， 你 可 以 提 
前 v1 事件 开始 时 间 ， 但 你 最 早 也 只 能 在 第 3 天 开始 。 跟 我 们 前 面 举 的 例 
子 ， 是 完 完 成 作业 再 玩 还 是 先 玩 最 后 完成 作业 一 个 道理 。 
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图 7-9-9 


8. 第 20~~31 行 古来 求 男 两 个 变量 活动 最 早 开 始 时 间 ete 和 活动 最 晚 开 始 
时 间 lte， 并 对 相同 下 标的 它们 做 比较 。 两 重 循环 能 套 旦 对 邻接 表 的 顶 


点 和 每 个 顶点 的 弧 表 过 历 。 

9 . 当 j=0 时 ， Mv 0 点 开始 ， <v 0V2 > 和 <v 0V1 > 两 条 弧 R “κελί. 
ete=etv[j]=etv[0]=0 ° lte=Itv[k]-e->weight=Itv[2]-len<v 9 ,v > >=4-4=0, Ι΄, 
时 ete=lte， 表 示 弧 <vov > KH, AUTEN ο ΗΚΞ1ΙΗΗ, 
ete=etv[j]=etv[0]=0 ° lte=ltv[k]-e->weight=ltv[1]-len<v ņọ ‚v 4 >=7-3=4, H 
时 etezlte， 因 此 <vo,v1> 并 不 是 关键 活动 ， 如 图 7-9-10 所 示 。 
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ete=etv[0H 
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图 7-9-10 


这 里 需要 解释 一 下 ，ete 本 来 是 表示 活动 <vkvj> 的 最 早 开 工时 间 ， 是 针 
对 弧 来 说 的 。 但 只 有 此 弧 的 弧 尾 顶 点 vj 的 事件 发 生 了 ， 它 才 可 以 开 
始 ， 因 此 ete=etv[k]。 


而 lte 表 示 的 是 活动 <vk,vj> 的 最 晚 开 工时 间 ， 但 此 活动 再 晚 也 不 能 等 vi 
事件 发 生 才 开始 ， 而 必须 要 在 vj 事 件 之 前 发 生 ， 所 以 lte=ltv[j]-len<vk ,v 
j>。 就 像 你 晚上 23 点 睡觉 ， 你 不 能 说 到 23 点 才 开 始 做 作业 ， 而 必须 要 
提前 2 小 时 ， 在 21 点 开始 ， 才 有 可 能 按时 完成 作业 。 


所 以 最 终 ， 其 实 就 是 判断 ete 与 te 是否 相等 ， 相 等 意味 着 活动 没有 任何 
空 卫 ， 是 关键 活动 ， 否 则 就 不 是 。10.，j=1 一 直到 j=9 为 止 ， 做 法 是 完全 
相同 的 关键 路 径 打 印 结果 为 “<v 0V2 >4,<V 2V3 >8,<V 3V4 >3,<V Δ»Ὗ7 
>4,<V 7,V8>5,<V8,V9>3,”， 最 终 关 键 路 径 如 图 7-9-11 所 示 。 


TOA 


分 析 整 个 求 关 键 路 径 的 算法 ， 第 6 行 是 拓扑 排序 ， 时 间 复 杂 度 为 
Or+e)， 第 8 一 9 行 时 间 复 杂 度 为 0m， 第 10 一 19 行 时 间 复 杂 度 为 
OO+e)， 第 20~-31 行 时 间 复 杂 也 为 On+e)， 根 据 我 们 对 时 间 复 杂 度 的 定 
义 ， 所 有 的 常数 系数 可 以 忽略 ， 所 以 最 终 求 关 键 路 径 算 法 的 时 间 复 杂 
度 依然 是 O(n+e)。 


实践 证 明 ， 通 过 这 样 的 算法 对 于 工程 的 前 期 工期 信 算 和 中 期 的 计划 调 
整 都 有 很 大 的 帮助 。 不 过 注意 ， 本 例 是 唯一 一 条 关键 路 径 ， 这 并 不 等 
于 不 存在 多 条 关键 路 径 的 有 癌 无 环 图 。 如 果 是 多 条 关键 路 径 ， 则 单 是 
提高 一 条 关键 路 径 上 的 关键 活动 的 速度 并 不 能 导致 整个 工程 缩短 工 
期 ， 而 必须 提高 同时 在 几 条 关键 路 径 上 的 活动 的 速度 。 这 就 像 仪 仅 是 
有 事业 的 成 功 ， 而 没有 健康 的 喘 体 以 及 快乐 的 生活 ， 是 根本 谈 不 上 至 
福 的 人 生 一 样 ， 三 者 缺 一 不 可 。 
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图 十 计算 机 科学 中 非常 党 用 的 一 类 数据 结构 ， 有 许 许多 多 的 计算 问题 
都 古 用 图 来 定义 的 。 由 于 图 也 十 最 复 淋 的 数据 结构 ， 对 它 讲解 时 ， 涉 
及 到 数组 、 链 表 、 栈 、 队 列 、 树 等 之 前 学 的 几乎 所 有 数据 结构 。 因 此 
ΙΙΙ '''... 
4 ο 


我 们 在 图 的 定义 这 一 三 ， 介 绍 了 一 大 堆 定 义 和 术 语 ， 一 开始 可 能 会 有 
些 迷 茫 ， 不 过 一 回 生 二 回 熟 ， 多 读 几 遇 ， 基 本 都 可 以 理解 并 记 住 它 们 
ο ας ως ασ ΕΠΗ 
Bul f° 


图 的 存储 结构 我 们 一 共 讲 了 五 种 ， 如 图 7-10-1 所 示 ， 其 中 比较 重要 的 是 
邻接 矩阵 和 邻接 表 ， 它 们 分 别 代表 看 边 集 古 用 数组 还 十 链表 的 方式 存 
储 。 十 字 链 表 是 针对 有 向 图 邻接 表 结 构 的 优化 ， 邻 接 多 重 表 是 针对 无 
回 图 邻接 表 绪 构 的 优化 。 边 集 数 组 更 多 考虑 的 是 对 边 的 关注 。 用 什么 
存储 结构 需要 具体 问题 具体 分 机 ， 通 稼 稠密 图 ， 或 读 存 数据 较 多 ， 结 
构 修改 较 少 的 匈 ， 用 邻接 矩阵 要 更 合适 ， 反 之 则 应 该 考虑 邻接 表 。 


RTE ΤΙ 
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图 7-10-1 


图 的 遍历 分 为 深度 和 广度 两 种 ， 各 有 优 缺 点 ， 束 像 人 在 追求 卓越 时 ， 
征 着 重 深度 还 是 看 重 广度 ， 总 是 很 难说 得 清楚 。 


图 的 应 用 是 我 们 这 一 章 浓 墨 重 彩 的 一 部 分 ， 一 共 谈 了 三 种 应 用 : 最 小 
生成 树 、 最 短路 径 和 有 向 无 环 图 的 应 用 。 


最 小 生成 树 ， 我 们 讲 了 两 种 算法 : 普 里 姆 (Prim) 算法 和 克 鲁 斯 卡尔 
(Kruskal) 算法 。 普 里 姆 算法 像 是 走 一 步 看 一 步 的 思维 方式 ， 逐 步 生 
成 最 小 生成 树 。 而 克 鲁 斯 卡尔 算法 则 更 有 全 局 意识 ， 直 接 从 图 中 最 短 
权 值 的 边 入 手 ， 找 寻 最 后 的 答案 。 


WAREMME AR, KIENET ARREA ο ΤΗΝ 

(Dijkstra) 算法 更 强调 单 源 顶点 查找 路 径 的 方式 ， 比 较 符 合 我 们 正常 
的 思路 ， 容 易 理 解 原理 ， 但 算法 代码 相对 复杂 。 而 弗 洛 伊 德 (Floyd) 
算法 则 完全 抛 开 了 单 点 的 局 限 思 维 方 式 ， 巧 妙 地 应 用 短 阵 的 变换 ， 用 
最 清 来 的 代码 实现 了 多 顶点 间 最 短路 径 求 解 的 方案 ， 原 理 理解 有 难 

度 ， 但 算法 编写 很 测 洛 。 


有 回 无 环 岁 时 单 应 用 于 工程 规划 中 ， 对 于 整个 工程 或 系统 来 说 ， 我 们 

方面 关心 的 是 工程 能 否 顺利 进行 的 问题 ， 通 过 拓扑 排序 的 方式 ， 我 
们 可 以 有 效 地 分 析出 一 个 有 同 图 是 否 存在 环 ， 如 来 不 存在 ， 那 它 的 拓 
扑 序列 是 什么 ? 男 一 方面 关心 的 是 整个 工程 完成 所 必须 的 最 短 时 间 问 
题 ， 利 用 求 关键 路 径 的 算法 ， 可 以 得 到 最 短 完成 工程 的 工期 以 及 关键 
的 活动 有 哪些 。 


事实 上， 图 的 应 用 算法 还 有 不 少 ， 本 章节 只 是 抛砖引玉 ， 有 兴趣 的 同 
学 可 以 去 查阅 相关 的 书籍 获得 更 多 的 知识 。 
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还 记得 我 们 章节 开头 谈 的 问题 吗 ? 如 果 现 在 对 应 该 如 何 去 做 还 答 不 上 
来 ， 那 融 非 常 不 应 该 了 。 全 国 所 有 省 市 的 最 佳 旅游 路 线 ， 只 要 你 可 以 
得 到 每 个 相 邻 城市 间 的 交通 距离 ， 其 实 就 是 最 小 生成 树 算 法 要 解决 的 
问题 。 当 然 现 实 中 ， 可 能 会 比较 复杂 ， 考 虑 的 因素 较 多 ， 但 再 复杂 的 
问题 也 是 从 基本 的 算法 开始 入 手 的 ， 你 都 已 经 拥有 了 人 金 手指 ， 还 担心 
不 能 点 石 成 金 吗 ? 


最 后 ， 我 用 网 络 上 非 钊 有 名 的 “世界 上 最 遥远 的 距离 .……” 造 句 ， 赠 送 
给 大 家 ， 来 结束 我 们 这 一 章 的 课程 。 


世界 上 最 遥远 的 距离 ， 

不 是 从 南极 到 北极 ， 

而 是 我 在 讲解 算法 为 何如 此 精妙 ， 
你 却 能 够 安详 在 课堂 上 休息 。 
世界 上 最 遥远 的 距离 ， 


不 是 珠 峰 与 马里 亚 纳 海沟 的 距离 ， 
而 是 我 欲 把 古人 的 智慧 全 盘 给 你 ， 
你 却 不 导 一 顾 毫 不 怜惜 。 
世界 上 最 遥远 的 距离 ， 
不 是 牛 A 与 牛 C 之 间 狭 小 空隙 ， 

而 是 你 们 当中 ， 

有 人 在 通 往 牛 有 逼 的 路 上 一 路 狂奔 ， 
而 有 人 步 入 大 学 校园 就 学 会 放弃 9 


Boe 查找 


启示 
查找 : 


查找 (Searching) 就 是 根据 给 定 的 某 个 值 ， 在 查找 表 中 确定 一 个 其 关 
键 字 等 于 给 定 值 的 数据 元 素 (或 记录 ) ο 


8.1 开场 白 


κ ο ο E αν 
FEI? 


当 你 精心 制作 了 一 个 网 页 、 或 写 了 一 篇 博客 、 或 者 上 传 一 组 照搬 到 互 
联网 上 ， 来 目 世 界 各 地 的 无 数 “ 蜂 蛛 ” 便 会 蜂拥 而 至 。 所 请 蜂 蛛 束 是 搜 
索引 擎 公司 服务 右上 的 软件 ， 它 如 同 蜂 蛛 一 样 把 互联 网 当成 了 蜂 蛛 
网 ， 没 日 没 夜 的 访问 互联 网 上 的 各 种 信息 。 


它 抓 取 并 复制 你 的 网 页 ， 且 通过 你 网 页 上 的 链接 息 上 更 多 的 页 面 ， 将 
所 有 信息 纳入 到 搜索 引擎 网 站 的 索引 数据 库 。 服 务 如 拆 解 你 网 页 上 的 


文字 内 容 、 标 记 关 键 词 的 位 置 、 字 体 、 颜 色 ， 以 及 相关 图 片 、 音 频 、 
视频 的 位 置 等 信息 ， 并 生成 庞大 的 索引 记录 ， 如 图 8-1-1 所 示 。 
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网 页 分 析 ， 提 取 链 接 


索引 数据 库 


图 8-1-1 


当 你 在 搜索 引擎 上 输入 一 个 单词 ， 点 击 “ 搜 索 ” 按 钮 时 ， 它 会 在 不 到 1 秒 
的 时 间 ， 带 着 单词 奔 向 索引 数据 库 的 每 个 “神经 末梢 ”， 检 索 到 所 有 包 
舍 搜 索 词 的 网 页 ， 依 据 它 们 的 浏览 次 数 与 关联 性 等 一 系列 算法 确定 网 
页 级 别 ， 排 列 出 顺序 ， 最 终 按 你 期 望 的 格式 呈现 在 网 页 上 。 


这 束 是 一 个 “关键 词 * 的 云 并 之 旅 。 在 过 去 的 10 多 年 里 ， 成 束 了 本 世纪 
最 早期 的 创新 明星 Google， 还 有 Yandex、Navar 和 和 百度 等 来 自 全 球 各 地 
的 搜索 3 引擎， 搜索 引擎 已 经 成 为 人 们 最 依赖 的 互联 网 工具 。 


作为 学 习 编程 的 人 ， 面 对 查找 或 者 叫做 搜索 (Search) 这 种 最 为 频繁 的 
操作 ， 理 解 它 的 原理 并 学 习 应 用 它 是 非常 必要 的 事情 ， 让 我 们 开始 
对 “Search” 的 探索 之 旅 吧 。 


8.2 ”查找 概论 


只 要 你 打开 电脑 ， 束 会 涉及 到 得 找 撤 术 。 如 炒股 软件 中 碍 股票 信息 、 

硬盘 文件 中 找 照片 、 在 光盘 中 搜 DVD， 甚 至 玩 游 戏 时 在 内 存 中 查找 攻 
击 力 、 魅 力 值 等 数据 修改 用 来 作 紫 等 ， 都 要 涉及 到 查找 。 当 然 ， 在 互 
联网 上 查找 信息 就 更 加 是 家 常 便 饭 。 所 有 这 些 需 要 被 查 的 数据 所 在 的 
集合 ， 我 们 给 它 一 个 统称 叫 查 找 表 。 


查找 表 (Search Table) 是 由 同一 类 型 的 数据 元 素 (或 记录 ) 构成 的 集 
合 。 例 如 图 8-2-1 就 是 一 个 查找 表 。 


关键 字 (Key) 是 数据 元 素 中 某 个 数据 项 的 值 ， 又 称 为 键 值 ， 用 它 可 以 
标识 一 个 数据 元 素 。 也 可 以 标识 一 个 记录 的 某 个 数据 项 (字段 ，， 我 
们 称 为 关键 码 ， 如 图 8-2-1 中 心 和 (所 示 。 


大 此 关键 字 可 以 唯一 地 标识 一 个 记录 ， 则 称 此 关键 子 为 主 天 键 子 

(Primary Κεν) 。 注 意 这 也 就 意味 着 ， 对 不 同 的 记录 ， 其 主 关 键 字 均 
不 相同 。 主 关键 字 所 在 的 数据 项 称 为 主 关 键 码 ， 如 图 8-2-1 中 心 和 中 所 
不 。 


那么 对 于 那些 可 以 识别 多 个 数据 元 素 (或 记录 ) 的 关键 字 ， 我 们 称 为 
次 关键 字 (SecondaryKey) ， 如 图 8-2-1 中 全 所 示 。 次 关键 字 也 可 以 理 
解 为 是 不 以 唯一 标识 一 个 数据 元 素 (或 记录 ) 的 关键 字 ， 它 对 应 的 数 
据 项 就 是 次 天 键 码 。 
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图 8-2-1 

查找 (Searching) 就 是 根据 给 定 的 某 个 值 ， 在 查 

找 表 中 确定 一 个 其 关键 字 等 于 给 定 值 的 数据 元 素 

(或 记录 ) 。 

若 表 中 存在 这 样 的 一 个 记录 ， 则 称 查找 是 成 功 的 ， 此 时 查找 的 结果 给 
出 整个 记录 的 信息 ， 或 指示 该 记录 在 查找 表 中 的 位 置 。 比 如 图 8-2-1 所 
示 ， 如 果 我 们 查找 主 关键 码 “ 代 码 ” 的 主 关键 字 为 “sh601398” 的 记录 时 ， 
就 可 以 得 到 第 2 条 唯一 记录 。 如 果 我 们 查找 次 关键 码 “ 涨 跌 

额 ”* 为 “-0.11” 的 记录 时 ， 就 可 以 得 到 两 条 记录 。 


否 表 中 不 存在 关键 字 等 于 给 定 值 的 记录 ， 则 称 查 找 不 成 功 ， 此 时 查找 
的 结果 可 给 出 一 个 “ 空 ” 记 录 或 “ 空 ”指针 5 


查找 表 按 照 操 作 方式 来 分 有 两 大 种 : 静态 查找 表 和 动态 查找 表 。 


静态 查找 表 (Static Search Table) : 只 作 查 找 操作 的 查找 表 。 它 的 主要 
操作 有 : (1) 查询 某 个 “特定 的 ”数据 元 素 是 否 在 查找 表 中 。 (2) 检 
索 某 个 “特定 的 ”数据 元 素 和 各 种 属性 。 


按照 我 们 大 多 数 人 的 理解 ， 碍 找 ， 当 然 是 在 已 经 有 的 数据 中 找到 我 们 
需要 的 。 静 态 查 找 就 是 在 干 这 样 的 事情 ， 不 过 ， 现 实 中 还 有 存在 这 样 
的 应 用 : 查找 的 目的 不 仅仅 只 是 查找 。 


比如 网 络 时 代 的 新 名 词 ， 如 反应 年 轻 人 生活 的 “蜗居 ”、“ 蚁 族 ”、“ 护 
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需要 对 某 网 站 上 亿 的 注册 用 户 进行 清理 工作 ， 注 销 一 些 非 法 用 户 ， 你 
就 需 查 找到 它们 后 进行 删除 ， 删 除 后 其 实 整个 查找 表 也 会 发 生变 化 。 
对 于 这 样 的 应 用 ， 我 们 束 引 入 了 动态 但 找 表 。 


动态 查找 表 (Dynamic Search Table) : 在 查找 过 程 中 同时 插入 查找 表 
中 不 存在 的 数据 元 素 ， 或 者 从 查找 表 中 删除 已 经 存在 的 荣 个 数据 元 

素 。 显 然 动 态 查找 表 的 操作 就 是 两 个 : (1) 查找 时 插入 数据 元 素 。 

(2) 查找 时 删除 数据 元 素 。 

为 了 提高 查找 的 效率 ， 我 们 需要 专门 为 查找 操作 设置 数据 结构 ， 这 种 
面向 查找 操作 的 数据 结构 称 为 查找 结构 。 

从 逻辑 上 来 说 ， 查 找 所 基于 的 数据 结构 是 集合 ， 和 集合 中 的 记录 之 间 没 
有 本 质 关 系 。 可 是 要 想 获 得 较 高 的 查找 性 能 ， 我 们 就 不 能 不 改变 数据 
元 素 之 间 的 天 系 ， 在 存储 时 可 以 将 查找 集合 组 织 成 表 、 树 等 结构 。 


例如 ， 对 于 静 仿 查找 表 来 说 ， 我 们 不 妨 应 用 线性 表 结 构 来 组 织 数 据 ， 
这 样 可 以 使 用 顺序 查找 算法 ， 如 果 再 对 主 关 键 字 排序 ， 则 可 以 应 用 折 
半 和 碍 找 等 技术 进行 高 效 的 查找 。 


Se 


另外 ， 还 可 以 用 散 列 表 结 构 来 解决 一 些 碍 找 问 题 ， 这 些 技术 都 将 在 后 
面 的 讲解 中 说 明 。 


8.3 ”顺序 表 查 找 


试想 一 下 ， 要 在 散落 的 一 大 堆 书 中 找到 你 需要 的 那 本 有 和 多么 据 烦 。 磁 
到 这 种 情况 的 人 大 都 会 考虑 做 一 件 事 ， 那 就 是 把 这 些 书 排列 整齐 ， 比 
如 坚 起 来 放置 在 书架 上 ， 这 样 根 据 书 名 ， 就 很 容易 查找 到 需要 的 图 
书 ， 如 图 8-3-1 所 示 。 


图 8-3-1 


散落 的 图 书 可 以 理解 为 一 个 集合 ， 而 将 它们 排列 整齐 ， 惑 如 同 是 将 此 
集合 构造 成 一 个 线性 表 。 我 们 要 针对 这 一 线性 表 进 行 查找 操作 ， 因 此 
EB SBIR ° 


此 时 凶 书 尽管 已 经 排列 整齐 ， 但 还 没有 分 类 ， 因 此 我 们 要 找 书 只 能 从 
头 到 尾 或 从 尾 到 头 一 本 一 本 碍 看， 直到 找到 或 全 部 查找 完 为 止 。 这 就 
是 我 们 现在 要 讲 的 顺序 查找 。 


顺序 查找 (Sequential Search) 又 叫 线性 查找 ， 是 最 基本 的 查找 技术 ， 
它 的 查找 过 程 是 ， 从 表 中 第 一 个 (或 最 后 一 个 ) 记录 开始 ， 逐 个 进行 
记 杂 的 关键 字 和 给 定 值 比较 ， 若 某 个 记 杂 的 关键 字 和 给 定 值 相等 ， 则 
查找 成 功 ， 找 到 所 查 的 记录 ; 如 果 直 到 最 后 一 个 (或 第 一 个 ) 记录 ， 
ο ο. ας 
ΤΗ ο 


8.3.1 顺序 表 查 找 算法 


顺序 查找 的 算法 实现 如 下 。 


/* 顺序 查找 ，a 为 数组 ，n 为 要 查找 的 数组 长 度 ， 


key 为 要 查找 的 关键 字 */ 


int Sequential Search(int *a, int n, int key) 


int i; 
forn E Ees TAE) 
ή 
if (a[i] == key) 
return i; 
} 
return 0; 
} 


这 段 代 码 非常 简单 ， 就 是 在 数组 a (注意 元 素 值 从 下 标 1 开 始 ) 中 查看 
有 没有 关键 字 (key) ， 当 你 需要 查找 复杂 表 结 构 的 记录 时 ， 只 需要 把 
数组 a 与 关键 字 key 定 义 成 你 需要 的 表 结构 和 数据 类 型 即 可 。 


8.3.2 ”顺序 表 查 找 优化 


到 这 里 并 非 足 够 完美 ， 因 为 每 次 循环 时 都 需要 对 i 是 否 越界 ， 即 是 否 小 
于 等 于 n 作 判断 。 事 实 上 ， 还 可 以 有 更 好 一 点 的 办 法 ， 设 置 一 个 哨兵 ， 
ΙΙ, 比较 。 看 下 面 的 改进 后 的 顺序 查找 算法 代 


/* 有 哨兵 顺序 查找 “7 


int Sequential_Search2(int *a, int n, int key) 


六 
N 


/* 设置 a[0] 为 关键 字 值 ， 我 们 称 之 为 “哨兵 ”* 


a[0] = key; 


/* 循环 从 数组 尾部 开始 */ 


ak = 


while (a[i] != key) 


/* 返回 0 则 说 明 查 找 失 败 */ 


return i; 


} 


此 时 代码 是 从 尾部 开始 查找 ， 由 于 a[0]=key， 也 就 是 说 ， 如 果 在 a[i 中 
有 key 则 返回 i 值 ， 碍 找 成 功 。 否 则 一 定 在 最 终 的 a[0] 处 等 于 key， 此 时 返 
回 的 古 0， 即 说 明 a[1]~a[n] 中 没有 关键 子 key， 查 找 失 败 。 


这 种 在 查找 方 辐 的 尽头 放置 "哨兵 ” 锡 去 了 在 查找 过 程 中 每 一 次 比较 后 
都 要 判断 查找 位 置 是 否 越界 的 小 技巧 ， 看 似 与 原先 震 别 不 大 ， 但 在 总 
数据 较 多 时 ， 效 率 提 高 很 大 ， 是 非常 好 的 编码 技巧 。 当 然 ,，“ 哨 兵 ” 也 
不 一 定 束 一 定 要 在 数组 开始 ， 也 可 以 在 末 闻 。 


对 于 这 种 顺序 查找 算法 来 说 ， 查 找 成 功 最 好 的 情况 就 是 在 第 一 个 位 置 
就 找到 了 ， 算 法 时 间 复 灯 度 为 0(1)， 最 坏 的 情况 是 在 最 后 一 位 置 才 找 
到 ， 需 要 n 次 比较 ， 时 间 复 杂 度 为 O(n)， 当 查找 不 成 功 时 ， 需 要 n+1 次 
比较 ， 时 间 复 杂 度 为 O(n)。 我 们 之 前 推导 过 ， 关 键 字 在 任何 一 位 置 的 
概率 是 相同 的 ， 所 以 平均 查找 次 数 为 (n+1)/2， 所 以 最 终 时 间 复 杂 度 还 
是 O(n)。 

很 显然 ， 顺 序 查 找 技术 是 有 很 大 缺点 的 ，n 很 大 时 ， 查 找 效率 极为 低 
下 ， 不 过 优点 也 是 有 的 ， 这 个 算法 非常 简单 ， 对 静态 查找 表 的 记录 没 
有 任何 要 求 ， 在 一 些小 型 数据 的 查找 时 ， 是 可 以 适用 的 。 


男 外 ， 也 正 由 于 查找 概率 的 不 同 ， 我 们 完全 可 以 将 容易 查找 到 的 记录 
放 在 前 面 ， 而 不 常用 的 记录 放置 在 后 面 ， 效 率 束 可 以 有 大 幅 提 高 。 


84 ”有 序 表 查找 


我 们 如 采 仅 仅 是 把 书 整 理 在 书架 上 ， 要 找到 一 本 书 还 是 比较 困难 的 ， 
也 就 是 刚才 讲 的 需要 逐个 顺序 查找 。 但 如 果 我 们 在 整理 书架 时 ， 将 图 
书 按照 书 名 的 拼音 排序 放置 ， 那 么 要 找到 某 一 本 书 承 相对 容易 了 。 放 
白 了 ， 就 是 对 图 书 做 了 有 序 排列 ， 一 个 线性 表 有 序 时 ， 对 于 查找 总 是 
很 有 帮助 的 。 


8.4.1 “ΠΈΣ 


我 们 在 讲 树 结构 的 二 又 树 定 义 《本 书 第 6.5 节 ) 时 ， 曾 经 提 到 过 一 个 小 
游戏 ， 我 在 纸 上 已 经 写 好 了 一 个 100 以 内 的 正 整数 数字 请 你 猜 ， 问 几 次 
可 以 猜 出 来 ， 当 时 已 经 介绍 了 如 何 最 快 猜 出 这 个 数字 。 我 们 把 这 种 每 
次 取 中 间 记 录 但 找 的 方法 叫做 折 半 查找 ， 如 图 8-4-1 所 示 。 
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图 8-4-1 


折 半 查找 (Binary Search) 41, ΧΜ 23Η » CAVE Pee ATER 
中 的 记录 必须 是 关键 码 有 序 (通常 从 小 到 大 有 序 ， 线 性 表 必 须 采 用 
顺序 存储 。 折 半 查 找 的 基本 思想 是 .在 有 序 表 中 ， 取 中 间 记 录 作 为 比 
较 对 象 ， 吞 给 定 值 与 中 间 记 录 的 关键 子 相 等 ， 则 查找 成 功 ， 若 给 定 值 
小 于 中 间 记 录 的 关键 字 ， 则 在 中 间 记 录 的 左 半 区 继续 查找 ， 若 给 定 值 
大 于 中 间 记 录 的 关键 字 ， 则 在 中 间 记 录 的 右 半 区 继续 查找 。 不 断 重复 
上 上述 过 程 ， 直 到 查找 成 功 ， 或 所 有 查找 区 域 无 记 有 好， 查找 失败 为 止 。 


假设 我 们 现在 有 这 样 一 个 有 序 表 数 组 {0,1,16,24,35,47,59,62,73,88,99}， 
除 0 下 标 外 共 10 个 数字 。 对 它 进 行 查找 是 否 存在 62 这 个 数 。 我 们 来 看 折 
半 查 找 的 算法 是 如 何 工作 的 。 


/* Tem */ 


int Binary_Search(int *a, int n, int key) 
τ 


int low, high, mid; 


Te E 义 最 低 标 为 记忆 H 


ΕΕ 
ΕἼ 
= 


low = 1; 


/* ce E O 3/ 


high = n; 
while (low <= high) 
ή 


/* HE 7 


mid = (low + high) / 2; 


/* BER */ 


if (key < a[mid]) 


/* 最 高 下 标 调整 到 中 位 下 标 小 一 位 */ 
high = mid - 1; 


/* 若 查 找 值 比 中 值 大 */ 


else if (key > a[mid]) 


/* 最 低下 标 调整 到 中 位 下 标 大 一 位 */ 


low = mid + 1; 


else 


/* 若 相等 则 说 明 mid 即 为 查找 到 的 位 置 */ 


return mid; 


return 0; 


1. 程序 开始 运行 ， 参 数 a={0,1,16,24,35,47,59,62,73,88,99}，n=10， 
key=62， 第 3~-5 行 ， 此 时 low=1，high=10， 如 图 8-4-2 所 示 。 
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图 8-4-2 
2， 第 6~15 行 循环 ， 进 行 查找 。 


3. 第 8 行 ，mid 计 算得 5， 由 于 a[5]=47<key， 所 以 执行 了 第 12 行 ， 
low=5+1=6， 如 图 8-4-3 所 示 。 
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图 8-4-3 


4. 再 次 循环 ，mid= (6+10)/2= 8， 此 时 a[8]=73>key， 所 以 执行 第 10 行 ， 
high=8-1=7， 如 图 8-4-4 所 示 
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图 8-4-4 


5. 再 次 循环 ，mid=(6+7)/2=6， 此 时 a[6]=59<key， 所 以 执行 12 行 ， 
low=6+1=7， 如 图 8-4-5 所 示 。 
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图 8-4-5 
6. 再 次 循环 ，mid=(7+7)/2=7， 此 时 a[7]=62=key， 查 找 成 功 ， 返 回 7。 


该 算法 还 是 比较 容易 理解 的 ， 同 时 我 们 也 能 感觉 到 它 的 效率 非常 高 。 
但 到 确 高 多 少 ? 关键 在 于 此 算法 的 时 间 复 杂 度 分 析 。 


首先 ， 我 们 将 这 个 数组 的 查找 过 程 绘制 成 一 棵 二 叉 树 ， 如 图 8-4-6 所 
示 ， 从 图 上 就 可 以 理解 ， 如 果 查 找 的 关键 字 不 是 中 间 记 录 47 的 话 ， 折 
半 查 找 等 于 是 把 静态 有 序 查找 表 4 238 ΒΡΕ ΓΝ, 即 查 找 结果 只 需要 
找 其 中 的 一 ο... 等 于 工作 量 少 了 一 半 ， 然 后 继续 折 半 查 
找 ， 效 率 当 然 是 非常 
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图 8-4-6 


我 们 之 前 6.6 节 讲 的 二 叉 树 的 性 质 4， 有 过 对 “具有 n 个 结 点 的 完全 二 又 树 
的 深度 为 。” 性 质 的 推导 过 程 。 在 这 里 尽管 折 半 查找 判定 二 广 树 并 不 是 
完全 二 又 树 ， 但 同样 相同 的 推导 可 以 得 出 ， 最 坏 情况 羡 查 找到 关键 字 
或 查找 失败 的 次 数 为 。 


有 人 还 在 问 最 好 的 情况 ? 那 还 用 说 吗 ， 当 然 是 1 次 了 。 


因此 最 终 我 们 折 半 算法 的 时 间 复 杂 度 为 OQdogn)， 它 显然 远 远 好 于 顺序 
查找 的 O(n) 时 间 复 杂 度 了 。 


不 过 由 于 折 半 查找 的 前 提 条 件 是 需要 有 序 表 顺 序 存储 ， 对 于 静态 查找 
表 ， 一 次 排序 后 不 再 变化 ， 这 样 的 算法 已 经 比较 好 了 “。 但 对 于 需要 频 


繁 执行 插入 或 删除 操作 的 数据 集 来 说 ， 维 护 有 序 的 排序 会 带 来 不 小 的 
工作 量 ， 那 束 不 建议 使 用 。 


8.4.2 ”插值 查找 
现在 我 们 的 新 问题 是 ， 为 什么 一 定 要 折 半 ， 而 不 是 折 四 分 之 一 或 者 折 


更 多 呢 ? 

打 个 比方 ， 在 英文 词典 里 查 “apple”， 你 下 意识 里 翻 开 词 典 是 翻 前 面 的 
书页 还 是 后 面 的 书页 呢 ? 如 果 再 让 你 查 “zoo”， 你 又 怎么 查 ? 很 显然 ， 
0 ΙΙ Σ:-; 
Ἢ ο 

图 8-4-7 


同样 的 ， 比 如 要 在 取 值 范围 0~10000 之 间 100 个 元 素 从 小 到 大 均匀 分 布 
的 数组 中 查找 5， 我 们 目 然 会 考虑 从 数组 下 标 较 小 的 开始 查找 。 


看 来 ， 我 们 的 折 半 查找 ， 还 是 有 改进 空间 的 。 
折 半 查找 代码 的 第 8 句 ， 我 们 略微 等 式 变 换 后 得 到 |: 


mid = = = or high-low) 


也 就 是 mid 等 于 最 低下 标 low 加 上 最 高 下 标 high 与 ow 的 差 的 一 半 。 算 法 
科学 家 们 考虑 的 就 是 将 这 个 1/2 进 行 改进 ， 改 进 为 下 面 的 计算 方案 : 


key - - allow | 
alhi oh |- dv] 


将 12 改 成 了 (key-allow])/(a[high]-allow]) 有 什么 道理 呢 ? 假设 a[11]= 
{0,1,16,24,35,47,59,62,73,88,99}，low=1，high=10， 则 a[low]=1， 
a[lhigh]=99， 如 有 果 我 们 要 找 的 是 key=16 时 ， 按 原来 折 半 的 做 法 ， 我 们 需 
要 四 次 (如 图 8-4-6) 才 可 以 得 到 结果 ， 但 如 果 用 新 办 法 ，(key- 
aflow])Ma[high]-afllow])=(16-1D)/(99-Ds0.153， 即 mids1+0.153x(10- 
1)=2.377 取 整 得 到 mid=2， 我 们 只 需要 二 次 就 查找 到 结果 了 ， 显 然 大 大 
提高 了 查找 的 效率 。 


μα 我 们 只 需要 在 折 半 查找 算法 的 代码 中 更 改 一 下 第 8 行 代码 如 


mid = low + (high - low] 


mid=low+ (high-low)*(key-a[low])/(a[high]-a[low]); /* 插值 */ 


就 得 到 了 男 一 种 有 序 表 查 找 算法 ， 插 值 查找 法 。 插 值 查找 
(Interpolation Search) 是 根据 要 查找 的 关键 字 key 与 查找 表 中 最 大 最 小 
记录 的 关键 字 比较 后 的 查找 方法 ， 其 核心 就 在 于 揪 值 的 计算 公式 (key- 
a[llow])/(a[high]-allow])。 应 该 说 ， 从 时 间 复 杂 度 来 看 ， 它 也 是 O(logn)， 
但 对 于 表 长 较 大 ， 而 关键 字 分 布 义 比较 均匀 的 查找 表 来 说 ， 插 值 查找 
算法 的 平均 性 能 比 折 半 查找 要 好 得 多 。 反 之 ， 数 组 中 如 果 分 布 类 似 
{0,1,2,2000,2001,.…...,999998,999999} 这 种 极端 不 均匀 的 数据 ， 用 插值 查 
找 未 必 是 很 合适 的 选择 ο 

8.4.3” 斐 波 那 契 查 找 

还 有 没有 其 他 办 法 ? 我 们 折 半 查找 是 从 中 间 分 ， 也 就 是 说 ， 每 一 次 查 
找 总 是 一 分 为 二 ， 无 论 数 据 偏 大 还 是 偏 小 ， 很 多 时 修 这 都 术 必 束 是 最 
ο... Bul FSA Pe ke, SEY ALE 
1 (Fibonacci Search) ， 它 是 利用 了 黄金 > 割 | 原理 来 实现 的 。 


SEAR RAN BA ERIE. BART, {ΠΥΕΘΗΜΗΊ 58 TE ο ἩΠΠ|7}| 
用 这 个 数列 来 作为 分 割 呢 ? 


为 了 能 够 介绍 清楚 这 个 查找 算法 ， 我 们 先 需 要 有 一 个 辈 波 那 契 数列 的 
数组 ， 如 图 8- 4-8 所 示 。 


ΣΤΕ 
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图 8-4-8 
下 面 我 们 根据 代码 来 看 程序 是 如 何 运行 的 。 


/* 斐 波 那 契 查找 */ 
int Fibonacci_Search(int *a, int n, int key) 
{ 


INE Low, bhron mia Ὁ, K; 


/* 定 义 最 低下 标 为 记录 首位 */ 


low = 1; 


/定义 最 高 下 标 为 记录 末 位 */ 
high = n; 


κ τος 


/* ΤΉ η TERRAE */ 


while (n > F[k] - 1) 
k++; 


/* 将 不 满 的 数值 补 全 */ 


fOr αἱ ΕΙΠΕ αἱ ες ka] ee αι) 
a[i] = a[n]; 

while (low <= high) 

{ 


/* 计算 当前 分 隔 的 下 标 */ 


mid = low + ΕΙΚ - 1] - 1; 


/* ΕΙΚ ΤΗΣ */ 


if (key < a[mid]) 


if 
/* 最 高 下 标 调整 到 分 隔 下 标 mid-1 处 */ 
high = mid - 1; 
/* 斐 波 那 契 数列 下 标 减 一 位 */ 
k=k- 1; 

J 


/* ΒΓΕ ΠΗ beidse */ 


else if (key > a[mid]) 


η 
/* 最 低下 标 调整 到 分 隔 下 标 mid+1 处 */ 
low = mid + 1; 
/* 斐 波 那 契 数列 下 标 减 两 位 */ 
κξκ-2; 

} 

else 

η 


if (mid <= n) 


/* 若 相等 则 说 明 mid 即 为 查找 到 的 位 


return mid; 


else 


/* 若 mid>n 说 明 是 补 全 数值 ， 返 回 n 


return n; 


WA 


ή 


} 


return 0; 


} 


1. 程序 开始 运行 ， 参 数 a={0,1,16,24,35,47,59,62,73,88,99}，n=10， 要 
查找 的 关键 字 key=59。 注 意 此 时 我 们 已 经 有 了 事先 计算 好 的 全 局 变量 
数组 FE 的 具体 数据 ， 它 是 辈 波 那 丰 数列 ，F={0,1,1,2,3,5,8,13,21,.……} ° 


Mr ϐ 4 5 { 


Te 


low high 


图 8-4-9 


2. 第 6 一 8 行 是 计算 当前 的 n 处 于 斐 波 那 契 数列 的 位 置 。 现 在 n=10，F[6] 
<n<F[7]， 所 以 计算 得 出 k=7。 


3. 第 9 一 10 行 ， 由 于 k=7， 计 算 时 是 以 F[7]=13 为 基础 ， 而 a 中 最 大 的 仅 
是 a[10]， 后 面 的 a[11]，a[12] 均 未 赋值 ， 这 不 能 构成 有 序数 列 ， 因 此 将 
它们 都 赋值 为 最 大 的 数组 值 ， 所 以 此 时 a[11]=a[12]=a[10]=99 (此 上 段 代 
码 作 用 后 面 还 有 解释 ) ° 


4. 第 11~31 行 查找 正式 开始 。 


5. 第 13 行 ，mid=1 十 F[7-1]-1=8， 也 就 是 说 ， 我 们 第 一 个 要 对 比 的 数值 
是 从 下 标 为 8 开始 的 。 


6. 由 于 此 时 key=59 而 a[8]j=73， 因 此 执行 第 16~17 行 ， 得 到 high=7， 


με 0 | 45 6 7 


eee 
Ἴ i 


7. 再 次 循环 ，mid=1 十 F[6-1]-1=5。 此 时 a[5]=47<key， 因 此 执行 第 21~- 
22 行 ， 得 到 low=6，k=6-2=4。 注意 此 时 k 下 调 2 个 单位 。 
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图 8-4-10 


图 8-4-11 


8. ἘΠΚΊΒΡΡ, mid=6+F[4-1]-1=7 9 Wh a[7]=62>key, AHA 16~ 
1711, t2llhigh=6, k=4-1=3 ° 
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图 8-4-12 
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9. 再 次 循环 ，mid=6 十 F[3-1]-1=6。 此 时 af[f6]=59=key， 因 此 执行 第 26~- 
27 行 ， 得 到 返回 值 为 6。 程序 运行 结束 。 

如 有 果 key=99， 此 时 查找 循环 第 一 次 时 ，mid=8 写 上 例 是 相同 的 ， 第 二 次 
循环 时 ，mid=11， 如 果 a[11] 没 有 值 就 会 使 得 与 key 的 比较 失败 ， 为 了 避 
免 这 样 的 情况 出 现 ， 第 9~10 行 的 代码 就 起 到 这 样 的 作用 。 

非 波 那 契 查找 算法 的 核心 在 于 : 

1) 当 key=a[mid] 时 ， 查 找 就 成 功 ; 


2) 当 key<a[mid] 时 ， 新 范围 是 第 low 个 到 第 mid-1 个 ， 此 时 范围 个 数 为 
F[k-1]-1 个 ; 


3) 当 key>a[mid]j 时 ， 新 范围 是 第 m+1 个 到 第 high 个 ， 此 时 范围 个 数 为 
F[k-2]-1 个 。 


Fk} 


low mid high 
F[k-1]-] 由 -| 
图 8-4-13 


也 惑 是 说 ， 如 有 条 要 碍 找 的 记录 在 右 侧 ， 则 左 侧 的 数据 都 不 用 再 判断 

了 ， 不 断 反 复 进 行 下 去 ， 对 处 于 当中 的 大 部 分 数据 ， 其 工作 效率 要 高 
一 些 。 所 以 尽管 辈 波 那 契 得 找 的 时 间 复 杂 也 为 Ddogn)， 但 束 平 均 性 能 
来 总 ， 裴 波 那 站 得 找 要 优 于 折 半 得 找 。 可 展 如 条 是 最 坏 情 况 ， 比 如 这 
ο ὗς; 


还 有 比较 关键 的 一 点 ， 折 半 碍 找 是 进行 加 法 与 除法 运算 (mid=(low+ 
high)/2) ， 插 值 查找 进行 复杂 的 四 则 运算 (mid=low 十 (high-low)*(key- 
alow])/(a[high]-a[low])) ， 而 韭 波 那 披 查找 只 是 最 简单 加 减法 运算 
(mid=low+F[k-1]-1) ， 在 海量 数据 的 查找 过 程 中 ， 这 种 细微 的 差别 
可 能 会 影响 最 终 的 查找 效率 ο 


应 该 说 ， 三 种 有 序 表 的 查找 本 质 上 是 分 隔 点 的 选择 不 同 ， 各 有 优 劣 ， 
实际 开发 时 可 根据 数据 的 特点 综合 考虑 再 做 出 选择 。 


8.5 ”线性 索引 查找 


我 们 前 面 讲 的 几 种 比较 高 效 的 查找 方法 都 是 基于 有 序 的 基础 之 上 的 ， 
但 事实 上 ， 很 多 数据 集 可 能 增长 非常 快 ， 例 如 ， 菏 些微 博 网 站 或 大 型 


论坛 的 帖子 和 回复 尽数 每 天 部 十 成 百 万 上 千 万 条 ， 如 图 8-5-1 所 示 ， 或 
着 一 些 服务 右 的 日 志 信 息 记 录 也 可 能 足 海量 数据 ， 要 你 证 记 杂 全 部 是 
按照 当中 的 某 个 关键 子 有 序 ， 其 时 间 代 价 是 非常 高 昂 的 ， 所 以 这 种 数 
据 通 常 都 是 按 先 后 顺序 存储 。 


Twitte! 每 日 币 博 数 达 9 二 万 话题 多 与 电视 相关 


RIBA twnter AT 2010-11-11 1114 WA) ALARM ΕΙΝ [8 


北京 时 间 11 月 11 日 消息 ，Twitter 高 管 罗 宾 , 斯 隆 (Robin Sloan) 今日 在 旧金山 举行 的 
NeWTeeVee 会 以 中 透露 ，Twittef 每 日 第 博 数量 已 达 9000 万 条 ， 其 中 绝 大 部 分 短 情 话题 与 电视 相 
+ 0 


图 8-5-1 
那么 对 于 这 样 的 查找 表 ， 我 们 如 何 能 够 快速 查找 到 需要 的 数据 呢 ? 办 


法 就 是 一 一 索引 。 


数据 结构 的 最 终 目 的 是 提高 数据 的 处 理 速度 ， 索 引 是 为 了 加 快 查 找 速 
度 而 设计 的 一 种 数据 结构 。 索 引 就 是 把 一 个 关键 字 与 它 对 应 的 记录 相 
关联 的 过 程 ， 一 个 索引 由 硅 干 个 索引 项 构成 ， 每 个 索引 项 至 少 应 包含 
关键 子 和 其 对 应 的 记录 在 存储 右 中 的 位 置 等 信息 。 索 引 技 术 古 组 织 
型 数据 库 以 及 磁盘 文件 的 一 种 重要 技术 。 


索引 按照 结构 可 以 分 为 线性 索引 、 树 形 索 引 和 多 级 索引 。 我 们 这 里 就 

只 介绍 线性 索引 技术 。 所 请 线性 索引 就 古 将 索引 项 集合 组 织 为 线性 结 

ο... ο 我 们 重点 介绍 三 种 线性 索引 : MERI > DRR 
[ 倒 排 索引 。 


8.5.1 稠密 索引 


我 母亲 年 纪 大 了 ， 记 忆 力 不 好 ， 经 常 在 家 里 找 不 到 东西 ， 于 是 她 想到 
了 一 个 办 法 。 她 用 一 小 本 子 记 录 了 家 里 所 有 小 东西 放置 的 位 置 ， 比 如 
户口 本 放 在 右手 床头柜 下 面 抽 敢 中 ， 针 线 放 在 电视 想 中 间 的 抽 屠 中 ， 
钞票 放 在 衣柜 .…... 咳 ， 这 个 就 不 提 了 (同学 们 坏 笑 ) 。 总 之 ， 她 老人 
家 把 这 些小 物品 的 放置 位 置 都 记录 在 了 小 本 了 于 上， 并 且 每 隅 一 段 时 间 
还 按照 本 子 整 理 一 裔 家 中 的 物品 ， 用 完 痢 放 回 原 处 ， 这 样 她 就 几乎 再 
没有 找 不 到 东西 。 

记得 有 一 次 我 申请 职称 时 ， 单 位 一 定 要 我 的 大 学 毕业 证 ， 我 在 家 里 找 
了 很 长 时 间 未 条 ， 和 急 得 要 死 。 和 老 妈 一 说 ， 她 的 神奇 小 本 子 马 上 发 挥 
作用 ， 一 下 子 束 找到 了 ， 原 来 被 她 整理 后 放 到 了 衣 橱 里 的 抽 敢 里 。 


从 这 件 事 束 可 以 看 出 ， 家 中 的 物品 尽管 是 无 序 的 ， 但 是 如 果 有 一 个 小 
本 子 记录 ， 寻 找 起 来 也 十 非常 容易 ， 而 这 小 本 了 于 整 古 索引 。 


稠密 索引 是 指 在 线性 索引 中 ， 将 数据 集中 的 每 个 记录 对 应 一 个 索引 
项 ， 如 图 8-5-2 所 示 。 


天 键 码 ”其 他 数据 项 
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图 8-5-2 


刚才 的 小 例子 和 稠密 索引 还 是 略 有 不 同 ， 家 里 的 东西 毕竟 少 ， 小 本 子 
再 多 也 束 儿 十 页 ， 全 部 翻 看 完 束 几 分 钟 时 间 ， 而 稠密 索引 要 应 对 的 可 
能 生成 干 上 万 的 数据 ， 因 此 对 于 笛 密 索引 这 个 索引 表 来 说 ， 索 引 项 一 
定 是 按照 关键 码 有 序 的 排列 。 


索引 项 有 序 也 就 意味 着 ， 我 们 要 查找 关键 字 时 ， 可 以 用 到 折 半 、 搬 

值 、 非 波 那 契 等 有 序 查 找 算法 ， 大 大 提高 了 效率 。 比 如 图 8-5-2 中 ， 我 
要 得 找 关 键 字 是 18 的 记录 ， 如 于 直接 从 右 侧 的 数据 表 中 碍 找 ， 那 只 能 
顺序 查找 ， 需 要 查找 6 次 才 可 以 查 到 结果 。 而 如 果 是 从 左 侧 的 索引 表 中 


找 ， 只 需 两 次 折 半 查找 就 可 以 得 到 18 对 应 的 指针 ， 最 终 查 找到 结 


这 显然 是 稠密 索引 优点 ， 但 是 如 采 数 据 集 非 党 大 ， 比 如 上 亿 ， 那 也 区 
意味 着 索引 也 得 同样 的 数据 集 长 度 规模 ， 对 于 内 存 有 限 的 计算 机 来 
说 ， 可 能 就 需要 反复 去 访问 磁盘 ， 碍 找 性 能 反而 大 大 下 降 了 。 


8.5.2 ”分 块 索引 
回想 一 下 图 书馆 是 如 何 藏书 的 。 显 然 它 不 会 是 顺序 摆 放 后 ， 给 我 们 一 


个 稠密 索引 表 去 查 ， 然 后 再 找到 书 给 你 。 图 书馆 的 图 书 分 类 摆 放 是 一 
门 非常 完整 的 科学 体系 ， 而 它 最 重要 的 一 个 特点 正 古 分 块 。 


图 8-5-3 


稠密 索引 因为 索引 项 与 数据 集 的 记录 个 数 相 同 ， 所 以 空间 代价 很 大 。 
为 了 减少 索引 项 的 个 数 ， 我 们 可 以 对 数据 集 进行 分 块 ， 使 其 分 块 有 
序 ， 然 后 再 对 每 一 块 建立 一 个 索引 项 ， 从 而 减少 索引 项 的 个 数 。 


分 块 有 序 ， 征 把 数据 集 的 记录 分 成 了 知 干 块 ， 并 且 这 些 块 需要 满足 两 
ών νά 


。 块 内 无 序 ， 即 每 一 块 内 的 记录 不 要 求 有 序 。 当 然 ， 你 如 采 能 够 让 
块 内 有 序 对 查找 来 说 更 理想 ， 不 过 这 就 要 付出 大 量 时 间 和 空间 的 
代价 ， 因 此 通常 我 们 不 要 求 块 内 有 序 。 

ο 块 间 有 序 ， 例 如 ， 要 求 第 二 块 所 有 记录 的 关键 字 均 要 大 于 第 一 块 
中 所 有 记录 的 关键 子 ， 第 三 块 的 所 有 记 杂 的 关键 子 均 要 大 于 第 二 
ο ο. T 因为 只 有 块 间 有 序 ， 才 有 可 能 在 查找 时 
AY? x «Δα ο 


对 于 分 块 有 序 的 数据 集 ， 将 每 块 对 应 一 个 索引 项 ， 这 种 索引 方法 叫做 
ο. 如 图 8-5-4 所 示 ， 我 们 定义 的 分 块 索 引 的 索引 项 结构 分 三 个 
效 据 项 : 


。 最 大 关键 码 ， 它 存储 每 一 块 中 的 最 大 关键 子 ， 这 样 的 好 处 束 是 可 
以 使 得 在 它 之 后 的 下 一 块 中 的 最 小 关键 字 也 能 比 这 一 块 最 大 的 天 
BEF EK; 

。 存储 了 块 中 的 记录 个 数 ， 以 便于 循环 时 使 用 ; 

a αν ο ο κ coe 
力 ο 


最 大 关键 码 块 长 ΜΗ 
0 ΕΙΠΕ. 
ΠΠΗ͂Ε 
2 ος 


图 8-5-4 
在 分 块 索 引 表 中 查找 ， 就 是 分 两 步 进 行 : 


1. 在 分 块 案 引 表 中 查找 要 查 关 键 字 所 在 的 块 。 由 于 分 块 索 引 表 是 块 间 有 
序 的 ， 因 此 很 容易 利用 折 半 、 插 值 等 算法 得 到 结果 。 例 如 ， 在 图 8-5-4 
的 数据 集中 查找 62， 我 们 可 以 很 快 可 以 从 左上 角 的 索引 表 中 由 
57<62<96 得 到 62 在 第 三 个 块 中 。 


2. 根 据 块 首 指针 找到 相应 的 块 ， 并 在 块 中 顺序 查找 关键 码 。 因 为 块 中 可 
以 是 无 序 的 ， 因 此 只 能 顺序 查找 。 


应 该 说 ， 分 块 索引 的 思想 是 很 容易 理解 的 ， 我 们 通常 在 整理 书架 时 ， 
都会 考虑 不 同 的 层 板 放置 不 同类 别 的 图 书 。 例 如 ， 我 家 里 就 十 最 上 层 
放 不 太 第 翻阅 的 小 说 书 ， 中 间 层 放 经 常用 到 的 如 菜谱 、 字 典 等 生活 和 
工具 用 书 ， 最 下 层 放 大 开本 比较 重 的 计算 机 书 。 这 束 是 分 块 的 概念 ， 
并 且 让 它们 块 间 有 序 了 。 人 至 于 上 层 中 《红楼 梦 》 是 应 该 放 在 《二 国 演 
义 》 的 左边 还 是 右边 ， 并 不 古 很 重要 。 毕 竞 要 找 小 说 《三 国 演义 》， 
只 需要 对 这 一 层 的 图 书 用 眼睛 扫 过 一 所 束 能 很 容易 查找 到 。 


我 们 再 来 分 析 一 下 分 块 索引 的 平均 查找 长 度 。 设 n 个 记录 的 数据 集 被 平 
均 分 成 m 块 ， 每 个 块 中 有 t 条 记录 ， 显 然 n=mxt， 或 者 说 m=mt。 再 假设 L 
b 为 查找 索引 表 的 平均 查找 长 度 ， 因 最 好 与 最 差 的 等 概率 原则 ， 所 以 L， 
的 平均 长 度 为 mm+1)/2。L 为 块 中 查找 记录 的 平均 查找 长 度 ， 同 理 可 知 
它 的 平均 查找 长 度 为 (t+1)/2。 


这 样 分 块 索引 查找 的 平均 查找 长 度 为 : 


AH Lyth 


注意 上 面 这 个 式 子 的 推导 是 为 了 让 整个 分 块 索引 查找 长 度 依赖 np 和 t 两 个 
变量 。 从 这 里 了 我 们 也 就 得 到 ， 平 均 长 度 不 仅仅 取决 于 数据 集 的 总 记 
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块 中 的 记录 数 t 相 同 ， 此 时 意味 着 n=mxtrt2 ， 即 ASL 、 
=1/2-(n/t+t)+1=t+1=sqrt(n)+1 ° 

可 见 ， 分 块 索引 的 效率 比 之 顺序 查找 的 OO) 是 高 了 不 少 ， 不 过 显然 它 


与 折 半 查找 的 O(logn) 相 比 还 有 不 小 的 差距 。 因 此 在 确定 所 在 块 的 过 程 
中 ， 由 于 块 间 有 序 ， 所 以 可 以 应 用 折 半 、 插 值 等 手段 来 提高 效率 。 


总 的 来 说 ， 分 块 索 引 在 兼顾 了 对 细 分 块 不 需要 有 序 的 情况 下 ， 大 大 增 
es A ee ee Ἱ'΄ 


8.5.3 IFPRI 


我 不 知道 大 家 有 没有 对 搜索 引擎 好 奇 过 ， 无 论 你 碍 找 什 么 样 的 信息 ， 
它 都 可 以 在 极 短 的 时 间 内 给 你 一 些 结果 ， 如 图 8-5-5 所 示 。 是 什么 算法 
技术 达到 这 样 的 高 效 查 找 呢 ? 


ipa 
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图 8-5-5 
我 们 在 这 里 介绍 最 简单 的 ， 也 算是 最 基础 的 搜索 技术 一 一 倒 排 索引 。 


我 们 来 看 样 例 ， 现 在 有 了 两 篇 极 短 的 英文 "文章 "一 一 其 实 只 能 算是 名 
子 ， 我 们 暂 认 为 它 古 文章 ， 编 号 分 别 是 1 和 2。 


1.Books and friends should be few but good. (读书 如 交友 ， 应 求 少 而 
精 。) 


2.A good book is a good friend. 〈 好 书 如 禁 友 。) 


假设 我 们 忽略 掉 如 “books”、“friends” 中 的 复数 “s” 以 及 如 “A” 这 样 的 大 小 
写 坟 异 。 我 们 可 以 整理 出 这 样 一 张 单词 表 ， 如 表 8-5-1 所 示 ， 并 将 单词 
做 了 排序 ， 也 就 是 表格 显示 了 每 个 不 同 的 单词 分 别 出 现 在 哪 篇 文章 
Νο ΟΝ '; 


表 8-5-1 


英文 单词 文章 编号 


82 

and 1 

be 1 

book 1,2 
but 1 

few 1 
friend 1,2 
good 1,2 
is 2 


should 1 
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索 框 中 填写 “book” 关 键 字 。 系 统 束 完 在 这 张 单词 表 中 有 序 查 找 “book”， 
找到 后 将 它 对 应 的 文章 编号 1 和 2 的 文章 地 址 (通常 在 搜索 引擎 中 就 是 
网 页 的 标题 和 链接 ) 返回 ， 并 告诉 你 ， 查 找到 两 条 记录 ， 用 时 0.0001 
秒 。 由 于 单词 表 是 有 序 的 ， 查 找 效 率 很 高 ， 返 回 的 又 只 是 文章 的 编 

号 ， 所 以 整体 速度 都 非常 快 。 

如 果 没 有 这 张 单词 表 ， 为 了 能 证 实 所 有 的 文章 中 有 还 是 没有 关键 

字 “book”， 则 需要 对 每 一 篇 文章 每 一 个 单词 顺序 查找 。 在 文章 数 是 海 
量 的 情况 下 ， 这 样 的 做 法 只 存在 理论 上 可 行 性 ， 现 实 中 是 没有 人 愿意 
本 

在 这 里 这 张 单 词 表 殉 是 索引 表 ， 索 引 项 的 通用 结构 是 : 


ο 次 天 键 码 ， 例 如 上 面 的 “更 文 单词 ”; 


。 记录 号 表 ， 例 如 上 面 的 “文章 编号 ”。 


其 中 记录 号 表 存 储 具 有 相同 次 关键 字 的 所 有 记录 的 记录 号 (可 以 是 指 
向 记录 的 指针 或 者 是 该 记录 的 主 关 键 字 ) 。 这 样 的 索引 方法 就 是 倒 排 
索引 (in-verted index) 。 倒 排 索引 源 于 实际 应 用 中 需要 根据 属性 (或 
字段 、 次 关键 码 ) 的 值 来 查找 记录 。 这 种 索引 表 中 的 每 一 项 都 包括 一 
个 属性 值 和 具有 该 属性 值 的 各 记录 的 地 址 。 由 于 不 是 由 记录 来 确定 属 
性 值 ， 而 是 由 属性 值 来 确定 记录 的 位 置 ， 因 而 称 为 倒 排 索引 。 


倒 排 索引 的 优点 显然 束 是 查找 记 杂 非 常 快 ， 基 本 等 于 生成 索引 表 后 ， 
查找 时 都 不 用 去 读 取 记 录 ， 束 可 以 得 到 结果 。 但 它 的 缺点 是 这 个 记录 
号 不 定 长 ， 比如 上 例 有 7 个 音 词 的 文章 编号 雁 πρ, 

而 “book”、“friend”、“good” 有 两 个 文章 编号 ， 若 是 对 多 篇 文章 所 有 单 
词 建立 倒 排 素 引 那 伍 个 单词 都 将 对 应 相当 多 的 文章 编号 维护 比较 
困难 ， 揪 入 和 删除 操作 都 需要 作 相 应 的 处 理 。 


当然 ， 现 实 中 的 搜索 技术 非常 复杂 ， 比 如 我 们 不 仅 要 知道 某 篇 文章 有 
要 搜索 的 关键 字 ， 还 想 知道 这 个 关键 字 在 文章 中 的 哪些 地 方 出 现 ， 这 
就 需要 我 们 对 记录 号 表 做 一 些 改良 。 再 比如 ， 文 章 编号 上 亿 ， 如 果 都 
用 长 数字 也 没 必要 ， 可 以 进行 压缩 ， 比 如 三 篇 文章 的 编号 

是 “112,115,119”， 我 们 可 以 记录 成 “112,+3,+4”， 即 只 记录 差 值 ， 这 样 每 
Kes MR AA ΒΓΕΙ; ERREFE H] AEH, 比如 前 一 条 
记录 的 关键 字 是 “and”* 而 后 一 条 是 “an-droid”， 那 么 后 面 这 个 可 以 改 

成 “<3,roid>”， 这 样 也 可 以 起 到 压缩 数据 的 作用 。 再 比如 搜索 时 ， 尽 管 
告诉 你 有 几 千 几 万 条 查找 到 的 记录 ， 但 其 实 真正 显示 给 你 看 的 ， 就 只 
是 当中 的 前 10 或 者 20 条 左右 数据 ， 只 有 在 点 击 下 一 页 时 才 会 获得 后 面 
的 部 分 索引 记录 ， 这 也 可 以 大 大 提高 了 整体 搜索 的 效率 。 


呵呵 ， 有 同学 说 得 没 错 ， 如 有 果 文 章 是 中 文 就 更 加 复杂 ο 比如 文章 中 出 
现 “ 中 国人 ”， ο ντ οτι 5 μου, “ 国 入 ii 
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他 们 会 满足 你 对 反 术 知识 的 询 求 。 


μις πα ος 布 望 可 以 让 你 对 搜索 技术 产生 
兴趣 ， 我 会 非常 欣 感 的 ， 休 已 一 


8.6 ”二 又 排序 树 


大 家 可 能 都 昕 过 这 个 故事 ， 说 有 两 个 年 轻 人 正在 深山 中 行走 。 名 然 发 
现 远 处 有 一 只 老虎 要 冲 过 来 ， 怎 么 办 ? BP NLS RH, A 
一 个 奇怪 地 问 : “你 系 鞋 带 干 什么 ? 你 不 可 能 跑 得 比 老虎 还 快 。” 系 鞋 
带 者 说 : “BAT A re DEVE? 我 只 要 跑 得 比 你 快 束 行 了 。” 


XR ERR MAY! 别 急 ， 如 采 你 的 朋友 是 系 鞋 市 着 ， 你 怎么 办 ? 
后 来 老虎 来 了 ， 系 鞋 带 者 拼命 地 跑 ， 另 一 人 则 急中生智 ， 疏 到 了 树 
E o QR eA Zl, Shenae, TEM 
FR... MORALE THEA ΑΛΑ, XR teal TAA 


OSs 
条 命 。 


πα ο κ ο ο 
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表 的 末端 ， 给 表 记 杂 数 加 一 即 可 ， 删 除 操作 可 以 是 删除 后 ， 后 面 的 记 
条 辣 前 移 ， 也 可 以 古 要 删除 的 元 素 与 最 后 一 个 元 素 互 换 ， 表 记 采 数 减 
一 ， 有 反正 整个 数据 集 也 没有 什么 顺序 ， 这 样 的 效率 也 不 错 。 应 该 说 ， 


插入 和 删除 对 于 顺序 存储 结构 来 说 ， 效 率 是 可 以 接受 的 ， 但 这 样 的 表 
由 于 无 序 造 成 查找 的 效率 很 低 ， 前 面 我 们 有 讲解 ， 这 束 不 在 虽 喧 。 


如 采 查 找 的 数据 集 是 有 序 线性 表 ， 并 且 是 顺序 存储 的 ， 查 找 可 以 用 折 
半 、 插 值 、 斐 波 那 契 等 查找 算法 来 实现 ， 可 惜 ， 因 为 有 序 ， 在 插入 和 
删除 操作 上 ， 就 需要 耗费 大 量 的 时 间 。 


有 没有 一 种 即 可 以 使 得 插入 和 删除 效率 不 错 ， 又 可 以 比较 高 效率 地 实 
现 碍 找 的 算法 呢 ? 还 真有 。 


我 们 在 8.2 节 把 这 种 需要 在 查找 时 插入 或 删除 的 查找 表 称 为 动态 查找 
表 。 我 们 现在 就 来 看 看 什么 祥 的 结构 可 以 实现 动态 查找 表 的 高 效率 。 


如 果 在 复杂 的 问题 面前 ， 我 们 束手无策 的 话 ， 不 妨 先 从 最 最 简单 的 情 
况 入 手 。 现 在 我 们 的 目标 是 插入 和 查找 同样 高 效 。 假 设 我 们 的 数据 集 
开始 只 有 一 个 数 {62}， 然 后 现在 需要 将 88 插 入 数据 集 ， 于 是 数据 集成 
了 {62,88}， 还 保持 着 从 小 到 大 有 序 。 再 查找 有 没有 58， 没 有 则 插入 ， 
可 此 时 要 想 在 线性 表 的 顺序 存储 中 有 序 ， 就 得 移动 62 和 88 的 位 置 ， 如 
图 8-6-2 左 图 ， 可 不 可 以 不 移动 呢 ? 咀 ， 当 然 是 可 以 ， 那 就 是 二 又 树 结 
构 。 当 我 们 用 二 又 树 的 方式 时 ， 首 先 我 们 将 第 一 个 数 62 定 为 根 结 点 ， 
88 因 为 比 62 大 ， 因 此 让 它 做 62 的 右 子 树 ，58 因 比 62 小 ， 所 以 成 为 它 的 
左 子 树 。 此 时 58 的 插入 并 没有 影响 到 62 与 88 的 关系 ， 如 图 8-6-2 右 图 所 
不 ο 
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图 8-6-2 


也 就 是 说 ， 若 我 们 现在 需要 对 集合 {62,88,58,47,35,73,51,99,37,93} 做 查 

找 ， 在 我 们 打算 创建 此 集合 时 就 考 虚 用 二 叉 树 结构 ， 而 且 是 排 好 序 的 

二 又 树 来 创建 。 如 图 8-6-3 所 示 ，62、88、58 创 建 好 后 ， 下 一 个 数 47 因 

比 58 小 ， 是 它 的 左 子 树 (UO) ，35 是 47 的 左 子 树 (WO) ，73 比 62 

大 ， 但 却 比 88 小 ， 是 88 的 左 子 树 CWO) ，51 比 62 小 、 比 58 小 、 比 47 

大 ， 是 47 的 右 子 树 GLO) ，99 比 62、88 都 大 ， 是 88 的 右 子 树 OL 

Θ) ，37 比 62、58、47 都 小 ， 但 却 比 35 大 ， 是 35 的 右 子 树 ( 见 @)) ，93 
则 因 比 62、88 大 是 99 的 左 子 树 ( 见 @) ο 


图 8-6-3 

这 样 我 们 就 得 到 了 一 棵 二 又 树 ， 并 且 当 我 们 对 它 进 行 中 序 遍 历时 ， 就 
可 以 得 到 一 个 有 序 的 序列 {35,37,47,51,58,62,73,88,93,99}， 所 以 我 们 通 
常 称 它 为 二 又 排序 树 5 


二 又 排序 树 (Binary Sort Tree) ， 又 称 为 二 又 查找 树 。 它 或 者 是 一 棵 空 
树 ， 或 者 是 具有 下 列 性 质 的 二 又 树 。 


藻 定 的 左 了 禁 不 室 ， 则 左 子 本 上 所 有 结 点 的 值 均 小 于 它 的 根 结构 
πμ ο WETH ο... 
它 的 左 、 右 子 树 也 分 别 为 二 又 排序 树 。 

从 二 又 排序 树 的 定义 也 可 以 知道 ， 它 前 提 是 二 又 树 ， 然 后 它 采 用 了 弟 
归 的 定义 方法 ， 再 者 ， 它 的 结 点 间 满 足 一 定 的 次 序 关系 ， 左 子 树 结 点 
一 定 比 其 双亲 结 点 小 ， 右 子 树 结 点 一 定 比 其 双亲 结 点 大 。 

构造 一 棵 二 又 排序 树 的 目的 ， 其 实 并 不 是 为 了 排序 ， 而 是 为 了 提高 查 
找 和 插入 删除 关键 字 的 速度 。 不 管 怎 么 说 ， 在 一 个 有 序数 据 集 上 的 查 
找 ， 速 度 总 是 要 快 于 无 序 的 数据 集 的 ， 而 二 又 排序 树 这 种 非 线性 的 结 
构 ， 也 有 利于 插入 和 删除 的 实现 。 

8.6.1 二 叉 排 序 树 查 找 操作 


首先 我 们 提供 一 个 二 又 树 的 结构 。 


/* 二 叉 树 的 二 又 链表 结 点 结构 定义 */ 
/* 结 点 结构 */ 
typedef struct BiTNode 
€ 
/* 结 点 数据 */ 


int data; 


/* EAB */ 


struct BiTNode *lchild, *rchild; 


} BiTNode, *BiTree; 


然后 我 们 来 看 看 二 又 排序 树 的 查找 是 如 何 实现 的 。 


/* 递归 查找 二 又 排序 树 T 中 是 否 存在 key，*/ 


/* 指针 f 指 向 T 的 双亲 ， 其 初始 调用 值 为 NULL */ 


/* 若 查 找 成 功 ， 则 指针 p 指 向 该 数据 元 素 结 点 ， 


返回 TRUE */ 
T 


/* 否则 指针 p 指 向 查找 路 径 上 访问 的 最 后 一 个 结 点 


返回 FALSE */ 


Status SearchBST(BiTree T, int key, BiTree f, BiTree *p) 
i 
/* 查找 不 成 功 */ 


(1) 


return FALSE; 
} 
/* 查找 成 功 */ 


else if (key == T->data) 


return TRUE; 


} 


else if (key < T->data) 


/* 在 左 子 树 继续 查找 */ 


return SearchBST(T->lchild, key, T, p); 


else 


/* 在 右 子 树 继续 查找 */ 


return SearchBST(T->rchild, key, T, p); 


J 


1. SearchBSTHŽ E&E — ANEITA A, RAAT IBAA 
SearchBST(T93,NULL,p)， 参 数 T 是 一 个 二 又 链表 ， 其 中 数据 如 图 8-6-3 
所 示 ，key 代 表 要 查找 的 关键 字 ， 目 前 我 们 打算 查找 93， 二 又 树 f 指 向 T 
的 双亲 ， 当 T 指 同根 结 点 时 ， 人 的 初 值 就 为 NULL， 它 在 递归 时 有 用 ， 最 
后 的 参数 p 是 为 了 查找 成 功 后 可 以 得 到 查找 到 的 结 点 位 置 。 


De. POST: 是 用 来 判断 当前 二 义 树 是 否 到 叶子 结 点 ， 显 然 图 8-6-3 告 
诉 我 们 当前 IT 指向 根 结 点 62 的 位 置 ，T 不 为 空 ， 第 5~6 行 不 执行 。 


3. 第 8~12 行 是 查找 到 相 匹 配 的 关键 字 时 执行 语句 ， 显 然 93 上 62， 第 10 
~11 行 不 执行 。 

4. 第 13~14 行 是 当 要 查找 关键 字 小 于 当前 结 点 值 时 执行 语句 ， 由 于 
93>62， 第 14 行 不 执行 。 


5. 第 15~16 行 是 当 要 查找 关 键 字 大 于 当前 结 点 值 时 执行 语句 ， 由 于 
93>62， 所 以 递归 调用 SearchBST(T->rchild,key,T,p)。 此 时 T 指 向 了 62 的 
右 孩 子 88， 如 图 8-6-4 所 示 。 


图 8-6-4 


6. 此 时 第 二 层 SearchBST， 因 93 比 88 大 ， 所 以 执行 第 16 行 ， 再 次 递归 
调用 SearchBST(T->rchildkeyTp)。 此 时 工 指向 了 88 的 右 孩 子 99， 如 图 8- 
6-5 所 示 。 


图 8-6-5 


7. 第 三 层 的 SearchBST， 因 93 比 99 小 ， 所 以 执行 第 14 行 ， 递 归 调 用 
SearchBST(T->lchild,key,T,p)。 此 时 T 指 向 了 99 的 左 孩 子 93， 如 图 8-6-6 所 


7S. 


图 8-6-6 

8. 第 四 层 SearchBST， 因 key 等 于 工 >data， 所 以 执行 第 10~11 行 ， 此 时 
指针 p 指 向 93 所 在 的 结 点 ， 并 返回 True 到 第 三 层 、 第 二 层 、 第 一 层 ， 最 
AK BOR [El True 5 

8.6.2 ”二 又 排序 树 插 入 操作 


有 了 二 又 排 序 树 的 查找 函数 ， 那 么 所 谓 的 二 又 排序 树 的 插入 ， 其 实 也 
束 定 将 关键 字 放 到 树 中 的 合适 位 置 而 已 ， 来 看 代码 。 


/* 当 二 又 排 序 树 T 中 不 存在 关键 字 等 于 key 的 数据 元 
素 时 ，“/ 


/* 插入 key 并 返回 TRUE， 否 则 返回 FALSE */ 


Status InsertBST(BiTree *T, int key) 
{ 
Bihneesp yess: 
ATEREA 
if (!SearchBST(*T, key, NULL, &p)) 
τν 
5 = (BiTree)malloc(sizeof(BiTNode) ); 
s->data = key; 
s->lchild = s->rchild = NULL; 
if (!p) 


/* 插入 s 为 新 的 根 结 点 */ 


*T = 5; 
else if (key < p->data) 


/* 播 入 s 为 左 孩 子 */ 


p->lchild = 5; 


else 


/* tiASAAERF */ 


p->rchild = s; 


return TRUE; 


} 


else 


/* 树 中 已 有 关键 字 相 同 的 结 点 ， 不 再 插入 */ 


return FALSE; 


这 段 代码 非常 简单 。 如 果 你 调用 函数 是 “In-sertBST(&T,93);”， 那 么 结果 
就 是 FALSE， 如 果 是 “InsertBST(&T'.95);”， 那 么 一 定 就 是 在 93 的 结 点 增 
加 一 个 右 孩 子 95， 并 且 返 回 True。 如 图 8-6-7 所 示 。 


图 8-6-7 


有 了 二 又 排序 树 的 插入 代码 ， 我 们 要 实现 二 又 排序 树 的 构建 驳 非 常 容 
易 了 。 下 面 的 代码 就 可 以 创建 一 棵 图 8-6-3 这 样 的 树 。 


ime is 
Πο cA πω, πο ος πο κι, πο ο, 
99, 37, 93}; 
BiTree T = NULL; 
ποπ οὗ «Οκ πρ ο) 
A 
InsertBST(&T, α[1]); 


} 


在 你 的 大 脑 里 ， 有 是 否 已 经 有 一 幅 随 厦 循 环 语句 的 运行 逐步 生成 这 株 二 
如 琳 不 能 ， 那 只 能 说 明 你 还 没 真理 解 它 的 原 
ΤᾺ ο 


8.6.3 ”二 又 排序 树 删除 操作 


俗话 说 “请 神 容易 送 神 难 ?*， 我 们 已 经 介绍 了 二 又 排序 树 的 查找 与 插入 
算法 ， 但 是 对 于 二 又 排序 树 的 删除 ， 残 不 是 那么 容易 ， 我 们 不 能 因为 
删除 了 结 点 ， 而 让 这 棵 树 变 得 不 满足 二 叉 排 序 树 的 特性 ， 所 以 删除 需 
要 考虑 多 种 情况 。 


如 果 需 要 查找 并 删除 如 37、51、73、93 这 些 在 二 又 排序 树 中 是 叶子 的 
结 点 ， 那 是 很 容易 的 ， 毕 竟 删 除 它 们 对 整 棵 树 来 说 ， 其 他 结 点 的 结构 
并 未 受到 影响 ， 如 图 8-6-8 所 示 。 


图 8-6-8 


对 于 要 删除 的 结 点 只 有 左 子 树 或 只 有 右 子 树 的 情况 ， 相 对 也 比较 好 解 
决 。 那 就 是 结 点 删除 后 ， 将 它 的 左 子 树 或 右 子 树 整个 移动 到 删除 结 点 
的 位 置 即 可 ， 可 以 理解 为 独子 继承 父 业 。 比 如 图 8-6-9， 就 是 先 删除 35 
和 99 结 点 再 删 除 58 结 点 的 变化 图 ， 最 终 ， 整 个 结构 还 是 一 个 一 又 排 
FH 。 


删除 35、99 两 结 点 删除 58 结 点 


图 8-6-9 


但 是 对 于 要 删除 的 结 总 既 有 左 子 树 又 有 右 子 树 的 情况 怎么 办 呢 ? 比如 
图 8-6-10 中 的 47 结 扩大 要 删除 了 ， 它 的 两 儿子 以 及 子孙 们 怎么 办 呢 ? 


图 8-6-10 


起 初 的 想法 ， 我 们 当 47 结 点 只 有 一 个 左 子 树 ， 那 么 做 法 和 一 个 左 于 树 
的 操作 一 样 ， 让 35 及 它 之 下 的 结 点 成 为 58 的 左 子 树 ， 然 后 再 对 47 的 右 
子 树 所 有 结 点 进行 插入 操作 ， 如 图 8-6-11 所 示 。 这 是 比较 简单 的 想法 ， 
可 是 47 的 右 子 树 有 子孙 共 5 个 结 点 ， 这 么 做 效率 不 高 且 不 说 ， 还 会 导致 
整个 二 又 排 序 树 结构 发 生 很 大 的 变化 ， 有 可 能 会 增加 树 的 高 度 。 增 加 
高 度 可 不 是 个 好 事 ， 这 我 们 待 会 再 说 ， 总 之 这 个 想法 不 太 好 。 


ii 47 连接 -~ 


5853545 | 


--- 

“ 

a παν -ο 
~-- 


“重新 换个 插入 


图 8-6-11 


FA FALE F, ATA SPS EP μι Η[ LRE 
WE? 果然 有 ，37 或 者 48 都 可 以 代替 47， 此 时 在 删除 47 后 ， 整 个 二 又 排 
序 树 并 没有 发 生 什么 本 质 的 改变 ο 


为 什么 是 37 和 48? 对 的 ， 它 们 正好 是 二 又 排序 树 中 比 它 小 或 比 它 大 的 
最 接近 47 的 两 个 数 。 也 就 是 说 ， 如 果 我 们 对 这 棵 二 又 排序 树 进 行 中 序 
遍历 ， 得 到 的 序列 {29,35,36,37,47,48,49,50,51,56,58,62,73,88,93,99}, © 
们 正好 是 47 的 前 驱 和 后 继 。 


因此 ， 比 较 好 的 办 法 束 是 ， 找 到 需要 删除 的 结 点 p 的 直接 前 驱 (或 直接 
后 继 ) s， 用 s 来 替换 结 点 p， 然 后 再 删除 此 结 点 s， 如 图 8-6-12 所 示 。 


删除 47 结 点 1) 47k EB a R37 PH de: 
2) 删除 37 结 点 ; 
3) 将 36 移 至 原 37 的 位 置 


1) 47 被 直接 后 继 48 莹 换 : 
2) 删除 48 结 点 ; 


图 8-6-12 
根据 我 们 对 删除 结 点 三 种 情况 的 分 析 : 


。 Γη ΓΕ; 

。 KAAS NA, 

。 左右 子 树 都 有 的 结 点 ， 我 们 来 看 代码 ， 下 面 这 个 算法 是 递归 方式 
对 二 又 排序 树 T 查 找 key， 查 找到 时 删除 ο 


/* 若 二 又 排序 树 T 中 存在 关键 字 等 于 key 的 数据 元 素 


时 ， 则 删除 该 数据 元 素 结 点 ，*/ 


/* 并 返回 TRUE; 否则 返回 FALSE */ 


Status DeleteBST(BiTree *T, int key) 


£ 
/* 不 存在 关键 字 等 于 key 的 数据 元 素 */ 
παρ (ΣΠ) 
return FALSE; 
else 
{ 
/* 找到 关键 字 等 于 key 的 数据 元 素 */ 
if (key == (*T)->data) 
return Delete(T); 
else if (key < (*T)->data) 
return DeleteBST(&(*T)->lchild, key); 
else 
return DeleteBST(&(*T)->rchild, key); 
} 
I 


BRAS All Bil AY = SE EK LASER), MEA BIE 
第 8 行 ， 此 时 执行 的 是 Delete 方 法 ， 对 当前 结 点 进行 删除 操作 。 我 们 来 
看 Delete 的 代码 。 


iN 


Τ 


BREW ART 3/ 


/* 从 二 又 排 序 树 中 删除 结 点 p， 并 
Status Delete(BiTree *p) 


{ 


BiTree q, S; 


/* 右 子 树 空 则 只 需 重 接 它 的 左 子 树 */ 


if ((*p)->rchild == NULL) 


i 
q = *p; 
MEERE e lehid? 
free(q); 

} 


/* 只 需 重 接 它 的 右 子 树 */ 


else if ((*p)->lchild == NULL) 
{ 
se o 
*p = (*p)->rchild; 
free(q); 
J 
/* 左右 子 树 均 不 空 */ 


else 


nL 
q = *p; s = (*p)->lchild; 


/* 转 左 ， 然 后 向 右 型 


i 


尽头 ( 找 待 删 结 点 的 前 驱 ) */ 


while (s->rchild) 
ή 
q = 5; 5 = s->rchild; 
} 
/* Ss 指 向 被 删 结 点 的 直接 前 驱 */ 


(*p)->data = s->data; 


if (q != *p) 


VX 


重 接 q 的 右 子 树 */ 


q->rchild = s->lchild; 


else 


IES 


重 接 q 的 左 子 树 */ 


q->lchild = s->lchild; 


free(s); 


} 


return TRUE; 


} 


1. 程序 开始 执行 ， 代 码 第 4~7 行 目的 是 为 了 删除 没有 右 子 树 只 有 左 子 
树 的 结 点 。 此 时 只 需 将 此 结 点 的 左 孩 子 替 换 它 和 目 己 ， 然 后 释放 此 结 点 
内 存 ， 束 等 于 删除 了 。 


2. 代码 第 8~11 行 是 同样 的 道理 处 理 只 有 右 子 树 没 有 左 子 树 的 结 点 删 


除 问题 。 


3. 第 12~25 行 处 理 复 洒 的 左右 于 树 均 存在 的 问题 。 


4. 第 14 行 ， 将 要 删除 的 结 点 p 赋 值 给 临时 的 变量 q， 再 将 p 的 左 孩子 p- 
>lchild 赋 值 给 临时 的 要 量 s。 此 时 q 指 癌 47 结 点 ，s 指 网 35 结 点 ， 如 图 8-6- 


13 所 示 。 


图 8-6-13 

5. 第 15~18 行 ， 循 环 找到 左 子 树 的 右 结 点 ， 直 到 右 侧 尽头 。 就 当前 例 
而 s 指 回 了 37 这 个 再 没有 右 子 树 的 结 点 ， 如 图 8- 
6-14 所 示 。 


ον ϐ 
@) G7) (8) 66 

35) ϱ9 (5 
图 8-6-14 


6. 第 19 行 ， 此 时 让 要 删除 的 结 点 p 的 位 置 的 数据 被 赋值 为 s->data， 即 
让 p->data=37， 如 图 8-6-15 所 示 。 


΄ 
ϱ ο (8) 65 
3) (8) o 
图 8-6-15 


7. 第 20~23 行 ， 如 果 p 和 gq 指向 不 同 ， 则 将 s->lchild 赋 值 给 q->rchild， 否 
则 束 是 将 s->lchild 赋 值 给 g->lchild。 显然 这 个 例子 p 不 等 于 q， 将 s->lchild 
指向 的 36 赋 值 给 q->rchild， 也 就 是 让 q->rchild 指 向 36 结 点 ， 如 图 8-6-16 
所 示 。 


ῷ 6) ὢ Ὁ 
ὦ ϐ ὃ 


图 8-6-16 


8. 第 24 行 ，free(s)， 束 非常 好 理解 了 ， 将 37 结 点 删除 ， 如 图 8-6-17 所 
ZR ο 


69 ὦ ἃ 
ὦ ὦ ὢ 


图 8-6-17 


从 这 段 代码 也 可 以 看 出 ， 我 们 其 实 是 在 找 删 除 结 点 的 前 驱 结 点 花 换 的 
方法 ， 对 于 用 后 继 结 点 来 蔡 换 ， 方 法 上 有 是 一 样 的 。 


86.4 二 又 排序 树 总 结 


总 之 ,二 又 排序 树 是 以 链接 的 方式 存储 ， 保 持 了 链接 存储 结构 在 执行 
插入 或 删除 操作 时 不 用 移动 元 素 的 优点 ， 只 要 找到 合适 的 插入 和 删除 
位 置 后 ， 仅 需 修改 链接 指针 即 可 。 揪 入 删除 的 时 间 性 能 比较 好 。 而 对 
于 二 又 排序 树 的 查找 ， 走 的 就 是 从 根 结 点 到 要 查找 的 结 点 的 路 径 ， 其 
比较 次 数 等 于 给 定 值 的 结 点 在 二 又 排序 树 的 层 数 。 极 端 情况 ， 最 少 为 1 
次 ， 即 根 结 点 束 是 要 找 的 结 点 ， 最 多 也 不 会 超过 树 的 深度 。 也 就 是 
说 ， 二 又 排 序 树 的 查找 性 能 取决 于 二 又 排序 树 的 形状 。 可 问题 就 在 
于 ， 二 文 排序 树 的 形状 是 不 确定 的 。 


例如 {62,88,58,47,35,73,51,99,37,93} 这 样 的 数组 ， 我 们 可 以 构建 如 图 8-6- 
18 左 图 的 二 又 排序 树 。 但 如 果 数 组 元 素 的 次 序 是 从 小 到 大 有 序 ， 如 
{35,37,47,51,58,62,73,88,93,99}， 则 二 又 排序 树 就 成 了 极端 的 右 斜 树 ， 
注意 它 依然 是 一 棵 二 又 排序 树 ， 如 图 8-6-18 的 右 图 。 此 时 ， 同 样 是 查找 
结 点 99， 左 图 只 需要 两 次 比较 ， 而 右 图 就 需要 10 次 比较 才 可 以 得 到 结 
果 ， 二 者 差异 很 大 。 


图 8-6-18 


也 就 是 说 ， 我 们 和 硕 望 二 又 排序 树 是 比较 平衡 的 ， 即 其 深度 与 完全 二 又 
树 相 同 ， 均 为 ， 那 么 查找 的 时 间 复 灯 也 整 为 O(logn)， 近 似 于 折 半 查 
tk, 事实 上 ， 图 8-6-18 的 左 图 也 不 够 平衡 ， 明 显 的 左 重 右 轻 。 


不 平衡 的 最 坏 情况 就 是 像 图 8-6-18 右 图 的 斜 树 ， 查 找 时 间 复 杂 度 为 
O(n)， 这 等 同 于 顺序 查找 。 


因此 ， 如 果 我 们 希望 对 一 个 集合 按 二 又 排序 树 查 找 ， 最 好 是 把 它 构建 
成 一 棵 平衡 的 二 又 排序 树 。 这 样 我 们 就 引申 出 另 一 个 问题 ， 如 何 让 二 
又 排序 树 平 衡 的 问题 。 


8.7 FH LH (AVL 树 ) 


我 在 网 络 上 ， 看 到 过 一 部 德国 人 制作 的 叫 《平衡 》 (英文 名 : 
Balance) 的 短片 ， 它 在 1989 年 获得 奥斯卡 最 佳 短片 奖 。 说 的 是 在 空 
中 ， 节 浮 着 一 个 四 方 的 平板 ， 上 面 站 立 着 5 个 人 ， 同 样 的 相貌 ， 同 样 的 
半 束 ， 同 样 的 面 无 表情 。 平 板 的 中 心 是 个 看 不 见 的 文 点 ， 为 了 平衡 ，5 
个 人 必须 寻找 合适 的 位 置 。 原 本 ， 催 单 的 站 在 中 心 承 可 以 了 ， 可 坪 ， 
如 同 我 们 一 样 ， 他 们 也 好 奇 于 这 个 世界 ， 想 知道 下 面 征 什 么 样子 。 而 
随 着 一 个 箱子 的 来 临 ， 这 种 平衡 被 打破 了 ， 箱 子 市 来 了 音乐 ， 带 来 了 
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平板 就 是 一 个 世界 ， 当 诱惑 降临 ， 当 人 心中 的 平衡 被 打破 ， 世 界 束 会 
混和 想 ， 最 后 留 下 的 只 有 抓 独 寂寞 失败 。 这 种 单调 的 机 械 化 社会 ， 禁 不 
住 诱惑 的 侵 串 ， 很 容易 朋 江 。 最 容易 个 侵蚀 的 ， 恰 恰 十 最 空虚 的 心 
Re 


图 8-7-1《 平 衡 》 


尽管 这 部 小 短片 很 精彩 ， 但 显然 我 们 课堂 上 古 没 时间 去 观摩 的 ， 有 兴 
εκ Ξ ο. 这 里 我 们 主要 是 讲 与 平衡 这 个 词 相关 的 
a ὦ 


平衡 二 又 树 (Self-Balancing Binary SearchTree=%Height-Balanced Binary 
Search Tree) ， 是 一 种 二 义 排 序 树 ， 其 中 每 一 个 节点 的 左 子 树 和 右 子 树 
的 高 度 差 至 多 等 于 1。 


有 两 位 俄罗斯 数学 家 G.M. Adelson-Velskii 和 E.M. Landis 在 1962 年 共同 发 
明 一 种 解决 平衡 二 又 树 的 算法 ， 所 以 有 不 少 资料 中 也 称 这 样 的 平衡 二 
又 树 为 AVL 树 。 


从 和 平衡 二 又 树 的 英文 名 字 ， 你 也 可 以 体会 到 ， 它 是 种 高 度 平衡 的 二 

又 排序 树 。 那 什么 叫做 高 度 平 衡 呢 ? 意思 是 说 ， 要 么 它 是 一 棵 空 树 ， 

要 么 它 的 左 子 树 和 右 子 树 都 是 平衡 二 又 树 ， 且 左 子 树 和 右 子 树 的 深度 

之 差 的 绝对 值 不 超过 1。 我 们 将 二 义 树 上 结 点 的 左 子 树 深度 减 去 右 子 树 
深度 的 值 称 为 平衡 因子 BF (Balance Factor) ， 那 么 平衡 二 又 树 上 所 有 
结 点 的 平衡 因子 只 可 能 是 -1、0 和 1。 只 要 二 叉 树 上 有 一 个 结 点 的 平衡 因 
子 的 绝对 值 大 于 1， 则 该 二 又 树 就 是 不 平衡 的 。 


看 图 8-7-2， 为 什么 图 1 是 平衡 二 叉 树 ， 而 图 2 却 不 是 呢 ? 这 里 就 是 考查 
我 们 对 平衡 二 又 树 的 定义 的 理解 ， 它 的 前 提 首 先是 一 棵 二 又 排序 树 ， 
右上 图 的 59 比 58 大 ， 却 是 58 的 左 子 树 ， ο. ο 
的 。 图 3 不 是 平衡 二 叉 树 的 原因 就 在 于 ， 结 点 58 的 左 子 树 高 度 为 3， 
右 子 树 为 空 ， 二 者 差 大 于 了 绝对 值 1， 因此 它 te 是 平衡 的 。 a 
当 的 调整 后 的 图 4， 它 束 符合 了 定义 ， 因 此 它 是 平衡 二 又 树 。 


图 ] 不 是 平衡 二 又 本 Ra FEAH 


图 8-7-2 
距离 插入 结 点 最 近 的 ， 且 平衡 因子 的 绝对 值 大 于 1 的 结 点 为 根 的 子 树 ， 
我 们 称 为 最 小 不 平衡 子 树 。 图 8-7-3， 当 新 插入 结 点 37 时 ， 距 离 它 最 近 


的 平衡 因子 绝对 值 超过 1 的 结 点 是 58 〈 即 它 的 左 子 树 高 度 3 减 去 右 子 树 


高 度 1) ， 所 以 从 58 开 始 以 下 的 子 树 为 最 小 不 平衡 子 树 。 


ας η 
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图 8-7-3 
8.7.1 “平衡 二 又 树 实现 原理 


平衡 二 又 树 构建 的 基本 思想 就 是 在 构建 二 又 排序 树 的 过 程 中 ， 每 当 插 
AMAR, ste BATA TIBOR TEE BITE, re, ΠΠ 
出 最 小 不 平衡 子 树 。 在 保持 二 又 排序 树 特性 的 前 提 下 ， 调 整 最 小 不 平 


ο ον οσα 进行 相应 的 旋转 ， 使 之 成 为 新 的 平 
(η 对 。 


为 了 能 在 讲解 算法 时 轻松 一 些 ， 我 们 先 讲 一 个 平衡 二 又 树 构建 过 程 的 
例子 。 假 设 我 们 现在 有 一 个 数组 a[10]={3,2,1,4,5,6,7,10,9,8} 需 要 构建 二 
又 排序 树 。 在 没有 学 习 平衡 二 又 树 之 前 ， 根 据 二 又 排序 树 的 特性 ， 我 
们 通常 会 将 它 构建 成 如 图 8-7-4 的 图 1 所 示 的 样子 。 昌 然 它 完 全 符合 二 又 
排序 树 的 定义 ， 但 是 对 这 样 高 度 达到 8 的 二 又 树 来 说 ， 查 找 是 非常 不 利 
的 。 我 们 更 期 望 能 构建 成 如 图 8-7-4 的 图 2 的 样子 ， 高 度 为 4 的 二 又 排序 
树 才 可 以 提供 高 效 的 查找 效率 。 那 么 现在 我 们 就 来 研究 如 何 将 一 个 数 
组 构建 出 图 2 的 树 结构 ο 


AW 

图 8-7-4 

对 于 数组 a[10]={3,2,1,4,5,6,7,10,9,8} 的 前 两 位 3 和 2， 我 们 很 正常 地 构 
建 ， 到 了 第 3 个 数 “1” 时 ， 发 现 此 时 根 结 点 “3” 的 平衡 因子 变 成 了 2， 此 时 


整 棵 树 都 成 了 最 小 不 平衡 子 村 ， 因 此 需要 调整 ， 如 图 8-7-5 的 图 1 ( 结 点 
左上 角 数 字 为 平衡 因子 BF 值 ) 。 因 为 BF 值 为 正 ， 因 此 我 们 将 整个 树 进 


{ΤΕ 〈 顺 时 针 旋 转 ) ， 此 时 结 点 2 成 了 根 结 点 ，3 成 了 2 的 右 孩 子 ， 这 
样 三 个 结 点 的 BF 值 均 为 0， 非 常 的 平衡 ， 如 图 8-7-5 的 图 2 所 示 。 


图 8-7-5 


然后 我 们 再 增加 结 点 4， 平 衡 因 子 没 有 超出 限定 范围 〈-1，0，1) ， 如 
图 3。 增 加 结 点 5 时 ， 结 点 3 的 BF 值 为 -2， 说 明 要 旋转 了 。 由 于 BF 古人 负 
值 ， 所 以 我 们 对 这 棵 最 小 平衡 子 树 进行 左旋 〈 逆 时 针 旋转 ) ， 如 图 4， 
此 时 我 们 整个 树 又 达到 了 平衡 。 


继续 ， 增 加 结 点 6 时 ， 发 现 根 结 点 2 的 BF 值 变 成 了 -2， 如 图 8-7-6 的 图 6。 
所 以 我 们 对 根 结 点 进行 了 左旋 ， 注 意 此 时 本 来 结 点 3 是 4 的 左 孩 子 ， 由 
于 旋转 后 需要 满足 二 又 排序 树 特 性 ， 因 此 它 成 了 结 点 2 的 右 孩 和子 ， 如 图 
7。 增 加 结 点 7， 同 样 的 左旋 转 ， 使 得 整 柠 树 达到 平衡 ， 如 图 8 和 图 9 所 
ην ο 


图 8-7-6 


当 增 加 结 点 10 时 ， 结 构 无 变化 ， 如 图 8-7-7 的 图 10。 再 增加 结 点 9， 此 时 
结 点 7 的 BF 变 成 了 -2， 理 论 上 我 们 只 需要 旋转 最 小 不 平衡 子 树 7、9、10 
即 可 ， 但 是 如 果 左 旋转 后 ， 结 点 9 就 成 了 10 的 右 孩 子 ， 这 是 不 符合 二 
排序 树 的 特性 的 ， 此 时 不 能 简单 的 左旋 ， 如 图 11 所 示 。 
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图 12 


图 8-7-7 


仔细 观察 图 11， 发 现 根本 原因 在 于 结 点 7 的 BF 是 -2， 而 结 点 10 的 BF 是 
1， 世 就 是 说 ， 它 们 俩 一 正 一 负 ， 符 号 并 不 统一 ， 而 前 面 的 儿 次 旋转 ， 
无 论 左 还 是 右 旋 ， 最 小 不 平衡 子 树 的 根 结 点 与 它 的 子 结 点 符号 都 是 相 
同 的。 这 就 是 不 能 直接 旋转 的 关键 。 那 怎么 办 呢 ? 
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结 点 10 进 行 右 旋 ， 使 得 结 点 10 成 了 9 的 右 子 树 ， 结 点 9 的 BF 为 -1， 此 时 
就 与 结 点 7 的 BF 值 符号 统一 了 ， 如 图 8-7-7 的 图 12 所 示 。 


这 样 我 们 再 以 结 点 7 为 最 小 不 平衡 子 树 进行 左旋 ， 得 到 图 8-7-8 的 图 13。 
接着 插入 8， 人 情况 与 刚才 类 似 ， 结 点 6 的 BF 是 -2， 而 它 的 右 孩 子 9 的 BF 是 
1， 如 图 14， 因 此 首先 以 9 为 根 结 点 ， 进 行 右 旋 ， 得 到 图 15， 此 时 结 点 6 
和 结 点 7 的 符号 都 是 负 ， 再 以 6 为 根 结 点 左旋 ， 最 终 得 到 最 后 的 平衡 二 

叉 树 ， 如 图 8-7-8 的 图 16 所 示 。 


图 8-7-8 


西方 有 一 句 民 证 是 这 样 说 的 : “丢失 一 个 箱子， 坏 了 一 只 蹄 铁 ; BAT 
只 蹄 铁 ， 折 了 一 匹 战马 ， 折 了 一 匹 战 马 ， 伤 了 一 位 骑士 ， 伤 了 一 位 骑 
士 ,， 输 了 一 场 战 斗 ， 输 了 一 场 战 斗 ， 亡 了 一 个 帝国 。” 相 信 大 家 应 该 有 
点 明白 ， 所 请 的 平衡 二 叉 树 ， 其 实 就 是 在 二 又 排序 树 创 建 过 程 中 保证 
它 的 平衡 性 ， 一 旦 发 现 有 不 平衡 的 情况 ， 蕊 上 处 理 ， 这 样 就 不 会 造成 
不 可 收拾 的 情况 出 现 。 通 过 刚才 这 个 例子 ， 你 会 发 现 ， 当 最 小 不 平衡 
子 树 根 结 点 的 平衡 因子 BF 是 大 于 1 时 ， 就 右 旋 ， 小 于 -1 时 就 左旋 ， 如 上 
例 中 结 点 1、5、6、7 的 插入 等 。 插 入 结 点 后 ， 最 小 不 平衡 子 树 的 BF 与 
它 的 子 树 的 BF 符号 相反 时 ， 就 需要 对 结 点 先进 行 一 次 旋转 以 使 得 符号 
| 
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8.7.2 “平衡 二 又 树 实现 算法 


好 了 ， 有 这 么 多 的 准备 工作 ， 我 们 可 以 来 讲解 代码 了 。 首 先是 需要 改 
进 二 又 排序 树 的 结 点 结构 ， 增 加 一 个 bf， 用 来 存储 平衡 因子 。 


/* 二 义 树 的 二 叉 链 表 结 点 结构 定义 */ 


/* 结 点 结构 */ 
typedef struct BiTNode 


{ 


/* 结 点 数据 */ 


int data; 


/* 结 点 的 平衡 因子 */ 


ΠΠ ΡΕ 


/* 左右 孩子 指针 */ 


struct BiTNode *lchild, *rchild; 


} BiTNode, *BiTree; 
然后 ， 对 于 右 旋 操作 ， 我 们 的 代码 如 下 。 


/* 对 以 p 为 根 的 二 叉 排序 树 作 右 旋 处 理 ， */ 


/* 处 理 之 后 p 指 向 新 的 树 根 结 点 ， 即 旋转 处 理 之 前 
的 左 子 树 的 根 结 点 */ 


void R_Rotate(BiTree *P) 


É 


BiTree L; 
/* 上 指向 P 的 左 子 树 根 结 点 */ 


- ΞΠΘ)Ε5ΙΣΠΗΠΙΡ 


/* 上 的 右 子 树 挂 接 为 P 的 左 子 树 */ 


(3Ρ)-Σ1οΠ114 = L->rchild; 
morh ue EPE 


/* P 指 向 新 的 根 结 点 */ 


*P = L; 


此 函数 代码 的 意思 是 说 ， 当 传 入 一 个 二 又 排序 树 P， 将 它 的 左 孩 子 结 点 
定义 为 L， 将 L 的 右 子 树 变 成 P 的 左 于 树 ， 再 将 P 改 成 L 的 右 于 树 ， 最 后 
将 L 和 其 换 P 成 为 根 结 点 。 这 样 下 完成 了 一 次 右 旋 操作 ， 如 网 8-7-9 所 示 。 
图 中 三 角形 代表 子 树 ，N 代 表 新 增 结 点 。 


插入 N 前 是 平衡 二 义 树 。 ”插入 N 后 是 平衡 性 打破 调整 后 恢复 平和 性 
图 8-7-9 
OO ee 


左旋 操作 代码 如 下 。 


/* 对 以 P 为 根 的 二 叉 排序 树 作 左旋 处 理 ， */ 
/* 处 理 之 后 P 指 向 新 的 树 根 结 点 ， 即 旋转 处 理 之 前 
的 右 子 树 的 根 结 点 9 */ 


void L_Rotate(BiTree *P) 


{ 


BiTree R; 


/* R 指 向 P 的 右 子 树 根 结 点 */ 


R = (*P)->rchild; 


/* R 的 左 子 树 挂 接 为 P 的 右 子 树 */ 


(*P)->rchild = R->1child; 
R->lchild = (*P); 


/* P 指 向 新 的 根 结 点 */ 


*P = R; 


这 上段 代码 与 右 旋 代码 是 对 称 的 ， 在 此 不 做 解释 了 。 上 面 例子 中 的 新 增 
结 点 5、6、7 (如 图 8-7-5 的 图 4、5， 图 8-7-6 的 图 6、7、8、9) , Bee 
旋 操 作 。 
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#define LH +1 /* 左 高 */ 
#define EHO /* 等 高 */ 
#define RH -1 /* Am */ 
/* 对 以 指针 T 所 指 结 点 为 根 的 二 叉 树 作 左 平衡 旋转 


μαι 


/* 本 算法 结束 时 ， 指 针 T 指 向 新 的 根 结 点 “/ 


void LeftBalance(BiTree *T) 
a 
BiTree L,Lr; 
/* 上 指向 T 的 左 子 树 根 结 点 */ 
[ES C21 yoealel patale|s 
switch (L->bf) 


{ 


/* 检查 T 的 左 子 树 的 平衡 度 ， 并 作 相 应 平衡 处 理 */ 


/* 新 结 点 插入 在 T 的 左 孩 子 的 左 子 树 上 ， 要 作 单 右 旋 处 理 */ 


case LH: 
(*T)->bf = L->bf = EH; 
R_Rotate(T); 


break; 


/* 新 结 点 插入 在 T 的 左 孩 子 的 右 子 树 上 ， 要 作 双 旋 处 理 “/ 


case RH: 


/* Lr 指向 T 的 左 孩 子 的 右 子 树 根 */ 


Lr = L->rchild; 


/* 修改 T 及 其 左 孩子 的 平衡 因子 


Switch (Lr->bf) 

i 

case LH: (*T)->bf 
L->bf = EH; 
break; 

case EH: (*T)->bf 
break; 


case RH: (*T)->bf 


Lessing = Ue 
break; 

} 

Lr->bf = EH; 


/* 对 T 的 左 子 树 作 左旋 平衡 处 理 


L_Rotate(&(*T)->lchild); 


/* 对 T 作 右 旋 乎 衡 处 理 


R_Rotate(T); 


首先 ， 我 们 定义 了 三 个 常数 变量 ， 


= L->bf = EH; 


= EH; 


y 


分 别 代表 1、0、-1。 


1. 函 数 被 调用 ， 传 入 一 个 需 调 整 平衡 性 的 子 树 T。 由 于 LeftBalance 函 数 
被 调用 时 ， 其 实 是 已 经 确认 当前 子 树 是 不 平衡 状态 ， 且 左 子 树 的 高 度 
大 于 右 子 树 的 高 度 。 换 句 话说 ， 此 时 T 的 根 结 点 


大 于 1 的 数 。 


2. 第 4 行 ， 我 们 将 T 的 左 孩 子 赋 值 给 L 9 
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3. 第 5 一 27 行 是 分 支 判 断 。 

4. 当 工 的 平衡 因子 为 LH， 即 为 1 时 ， 表 明 它 与 根 结 点 的 BF 值 符号 相同 ， 
因此 ， 第 8 行 ， 将 它们 的 BF 值 都 改 为 0， 并 且 第 9 行 ， 进 行 右 旋 操 作 。 操 
作 的 方式 如 图 8-7-9 所 示 。 

5. 当 工 的 平衡 因子 为 RH， 即 为 -1 时 ， 表 明 它 与 根 结 点 的 BF 值 符号 相反 ， 
此 时 需要 做 双 旋 处 理 。 第 13 一 22 行 ， 针 对 工 的 右 孩 子 L ,的 BF 作 判 断 ， 
修改 根 结 点 T 和 L 的 BF 值 。 第 24 行 将 当前 L ,的 BF 改 为 0。 

6. 第 25 行 ， 对 根 结 点 的 左 子 树 进行 左旋 ， 如 图 8-7-10 第 二 图 所 示 。 


7. 第 26 行 ， 对 根 结 点 进行 右 旋 ， 如 图 8-7-10 的 第 三 图 所 示 ， 完 成 平衡 操 


0 
插入 Ls 后 平衡 性 被 打破 ， 
插入 Ls 前 是 平衡 二 义 树 ”” 先 左旋 以 保证 根 结 点 和 它 


的 左 孩 了 BF 符号 相同 


冉 右 旋 调整 其 平衡 忻 调整 后 恢复 平衡 


图 8-7-10 
ον 右 平 衡 旋转 处 理 的 函数 代码 非常 类 似 ， 直 接 看 代码 ， 不 做 讲 
Te 


我 们 前 面 例子 中 的 新 增 结 点 9 和 8 就 是 典型 的 右 平 衡 旋转 ， 并 且 双 旋 完 
ο. (如 图 8-7-7 的 图 11、12， 图 8-7-8 的 图 14、15、16 所 
不 ο 


有 了 这 些 准备 ， 我 们 的 主 函 数 才 算是 正式 登场 了 。 


/* 若 在 平衡 的 二 又 排序 树 T 中 不 存在 和 e 有 相同 关键 


字 的 结 点 ， 则 插入 一 个 */ 


/* 数据 元 素 为 e 的 新 结 点 并 返回 1， 否 则 返回 9。 车 


轩 插 入 而 使 二 又 排 序 树 3/ 
/* 失去 平衡 ， 则 作 平 衡 旋转 处 理 ， 布 尔 变 量 taller 


反映 T 长 高 与 否 。 */ 
Status InsertAVL(BiTree *T, int e, Status *taller) 
η 
ale (ΗΠΙ) 


i 


/* 插入 新 结 点 ， 树 “长 高 ?， 置 taller 为 TRUE */ 


*T = (BiTree)malloc(sizeof(BiTNode)); 
(*T)->data = e; 

(*T)->lchild = (*T)->rchild = NULL; 
(*T)->bf = EH; 


*taller = TRUE; 


else 


if (e == (*T)->data) 


{ 


/* 树 中 已 存在 和 e 有 相同 关键 字 的 结 点 则 不 再 插入 */ 


*taller = FALSE; 
return FALSE; 

J 

if (e < (*T)->data) 


{ 


/* 应 继续 在 T 的 左 子 树 中 进行 搜索 */ 


/* AA 3/ 


if (!InsertAVL(&(*T)->lchild, e, taller)) 


return FALSE; 


a 


/* 已 插 入 到 T 的 左 子 树 


和子 树 “ 长 高 ”*/ 


if (*taller) 


/* 检查 T 的 平衡 度 */ 


switch ((*T)->bf) 
{ 
/* 原本 左 子 树 比 右 子 树 高 ， 需 要 作 左 平衡 处 理 */ 


case LH: 
LeftBalance(T); 
*taller = FALSE; 


break; 


/* 原本 左右 子 树 等 高 ， 现 因 左 子 树 增高 而 树 增高 */ 


case ΕΗ: 
JE 
*taller = TRUE; 


break; 


/* 原本 右 子 树 比 左 子 树 高 ， 现 左右 子 树 等 高 */ 


case RH: 
(1) -sbf = ΕΗ: 
*taller = FALSE; 


break; 


else 


/* 应 继续 在 T 的 右 子 树 中 进行 搜索 */ 


/* RA */ 


if (!InsertAVL(&(*T)->rchild, e, taller)) 


return FALSE; 


/* 已 插入 到 T 的 右 子 树 且 右 子 树 “ 长 高 ”*/ 


if (*taller) 


/* 检查 T 的 平衡 度 */ 
switch ((*T)->bf) 
{ 


/* 原本 左 子 树 比 右 子 树 高 ， 现 左 、 右 子 树 等 高 */ 


case LH: 
(ΠΠ ΞΞΗΓΠΙΞΙΕΗΣ 
*taller = FALSE; 


break; 


/* 原本 左右 子 树 等 高 ， 现 因 右 子 树 增高 而 树 增高 “/ 


case EH: 
CT- >b = RÄ? 
*taller = TRUE; 


break; 


/* 原本 右 子 树 比 左 子 树 高 ， 需 要 作 右 平衡 处 理 */ 


case RH: 
RightBalance(T); 
*taller = FALSE; 


break; 


} 


return TRUE; 


} 


1. 程 序 开 始 执行 时 ， 第 3~10 行 是 指 当 前 IT 为 空 时 ， 则 申请 内 存 新 增 一 个 
结 点 。 2. 第 13~17 行 表示 当 存 在 相同 结 点 ， 则 不 需要 插入 。 3.58 18~ 
40 行 ， 当 新 结 点 e 小 于 TI 的 根 结 点 值 时 ， 则 在 TI 的 左 子 树 查找 。 4.5520-- 
21 行 ， 弟 归 调 用 本 函数 ， 直 到 找到 则 返回 false， 否 则 说 明 插 入 结 点 成 
功 ， 执 行 下 面 语句 。 5. 第 22~39 行 ， 当 taller 为 TRUE 时 ， 说 明 揪 入 了 结 
点 ， 此 时 需要 判断 Tf 的 平衡 因子 ， 如 果 是 1， 说 明 左 子 树 高 于 右 子 树 ， 

需要 调用 LeftBalance 函 数 进行 左 平衡 旋转 处 理 。 如 果 为 0 或 -1， 则 说 明 
新 揪 入 结 点 没有 让 整 棵 二 又 排序 树 失 去 平衡 性 ， 只 需要 修改 相关 的 BE 
值 即 可 。 6. 第 41~63 行 ， 说 明 新 结 点 e 大 于 TI 的 根 结 点 的 值 ， 在 工 的 右 子 
树 查 找 。 代 码 上 述 类 似 ， 不 再 详 述 。 


对 于 这 段 代 码 来 说 ， 我 们 只 需要 在 需要 构建 平衡 二 又 树 的 时 候 执 行 如 
下 列 代码 即 可 在 内 存 中 生成 一 棵 与 图 8-7-4 的 图 2 相同 的 平衡 的 二 叉 树 。 


inte is 
yi αμ ἘΞ δε «εἴ, ο y αρ (θη e y {eed 
BiTree T = NULL; 
Status taller; 
mole (αἱ ο πι alle) πο) 
{ 
InsertAVL(&T, a[i], &taller); 


} 


不 容易 ， 终 于 讲 完了 ， 本 算法 代码 很 长 ， 是 有 些 复杂 ， 编 程 中 容易 在 
很 多 细 方 上 出 错 ， 要 想 真正 掌握 它 ， 逢 要 同学 们 目 己 多 练习 。 不 过 其 
思想 还 古 不 难 理解 的 ， 总 之 束 古 把 不 平衡 消炎 在 最 早 时 刻 。 


如 果 我 们 需要 查找 的 集合 本 和 喘 没 有 顺序 ， 在 频繁 查找 的 同时 也 需要 经 

常 的 插入 和 删除 操作 ， 显 然 我 们 需要 构建 一 棵 二 又 排序 树 ， 但 是 不 平 

衡 的 二 叉 排序 树 ， 查 找 效率 是 非常 低 的 ， 因 此 我 们 需要 在 构建 时 ， 就 

让 这 棵 二 叉 排 序 树 是 平衡 二 叉 树 ， 此 时 我 们 的 查找 时 间 复 杂 度 就 为 

o το ο ος 
? 法 。 


8.8 SEA (BM) 


aS hk Ml KEBE (Be) Βη ΕΠΗ ΝΞ. “要 观察 一 个 公 
EM 15, Ata TemAbe { » ΠΕ} 2.55 ah Mab Ae 
市 一 张嘴 ， 即 兴 发 言 ， 这 肯定 是 一 家 不 挛 间 的 公司 ， 因 为 肯定 每 一 个 
人 都 只 是 用 直觉 与 反射 神经 在 互相 应 对 ， 不 可 能 有 深度 的 思考 与 规 

2 语言 是 沟通 的 工具 ， 文 字 是 记录 存 证 的 工具 ， 而 文字 化 的 过 
程 ， 又 可 以 让 思考 彻底 况 狂 ， 善 于 使 用 文字 的 人 ， 通 音 是 深沉 而 产 齐 
的 。? 显 然 ， 这 是 一 个 很 好 理解 的 观点 ， 但 许多 人 都 难以 做 到 它 。 


图 8-8-1 
要 是 我 们 把 开会 比 作 内 存 中 的 数据 处 理 的 话 ， 那 么 写 下 来 和 时 常 阅读 


它 就 是 内 存 数据 对 外 存 磁 盘 上 的 存 取 操作 了 。 
内 存 一 般 都 是 由 硅 制 的 存储 芯片 组 成 ， 这 种 技术 的 每 一 个 存储 单位 代 


ΕΞ. 


里 


价 都 要 比 磁 存 储 技术 昂贵 两 个 数量 级 ， 因 此 基于 磁盘 技术 的 外 存 ， 容 


比 内 存 的 容量 至 少 大 两 个 数量 级 。 这 也 殉 是 目前 PC 通 和 党 内 存 几 个 G 


而 


我 们 前 面 讨 论 过 的 数据 结构 ， 处 理 数 据 都 是 在 内 存 中 ， 因 此 考虑 的 都 


已 、 而 人 硬盘 却 可 以 成 百 上 千 G 容 量 的 原因 。 


是 内 存 中 的 运算 时 间 复 杂 度 。 


但 如 若 我 们 要 操作 的 数据 集 非常 大 ， 大 到 内 存 已 经 没 办 法 处 理 了 怎么 
办 呢 ? 如 数据 库 中 的 上 千 万 条 记录 的 数据 表 、 硬 盘 中 的 上 万 个 文件 
等 。 在 这 种 情况 下 ， 对 数据 的 处 理 需 要 不 断 从 硬盘 等 存储 设备 中 调 入 
或 调 出 内 存 页 面 。 


一 旦 涉及 到 这 样 的 外 部 存储 设备 ， 关 于 时 间 复 洒 度 的 计算 束 会 发 生变 
化 ， 访 问 该 集合 元 素 的 时 间 已 经 不 仅仅 是 寻找 该 元 素 所 需 比较 次 数 的 
函数 ， 我 们 必须 考虑 对 硬盘 等 外 部 存储 设备 的 访问 时 间 以 及 将 会 对 该 
设备 做 出 多 少 次 单独 访问 。 


试想 一 下 ， 为 了 要 在 一 个 拥有 儿 十 万 个 文件 的 磁盘 中 查找 一 个 文本 文 
件 ， 你 设计 的 算法 需要 读 取 磁盘 上 万 次 还 是 读 取 几 十 次 ， 这 是 有 本 质 
差异 的 。 此 时 ， 为 了 降低 对 外 存 设备 的 访问 次 数 ， 我 们 就 需要 新 的 数 
据 结构 来 处 理 这 样 的 问题 。 


我 们 之 前 谈 的 树 ， 痢 症 一 个 结 点 可 以 有 多 个 孩子 ,但 十 它 目 身 只 存储 
一 个 元 素 。 二 叉 树 限制 更 多 ， 结 点 最 多 只 能 有 两 个 孩子 。 


一 个 结 点 只 能 存储 一 个 元 素 ， 在 元 素 非 单 多 的 时 候 ， 束 使 得 要 么 树 的 
度 非常 大 〈 结 点 拥有 子 树 的 个 数 的 最 大 值 ) ， 要 么 树 的 高 度 非常 大 ， 
甚至 两 首都 必须 足够 大 才 行 。 这 束 使 得 内 存 存 取 外 存 次 数 非 第 多 ， 这 
显然 成 了 时 间 歼 率 上 的 瓶颈 ， 这 授 使 我 们 要 打破 每 一 个 结 点 只 存储 一 
个 元 素 的 限制 ， 为 此 引入 了 多 路 查找 树 的 概念 。 


多 路 查找 树 (muitl-way search tree) ， 其 每 一 个 结 点 的 孩子 数 可 以 多 于 
两 个 ， 且 每 一 个 结 点 处 可 以 存储 多 个 元 素 。 由 于 它 是 查找 树 ， 所 有 元 
素 之 间 存 在 某 种 特定 的 排序 关系 。 


在 这 里 ， 每 一 个 结 氮 可 以 存储 多 少 个 元 素 ， 以 及 它 的 孩子 数 的 多 少 是 
Te ο κ ο α- ὸ 
UBP ο 


8.8.1 2-3 树 


说 到 二 三 ， 我 殉 会 想起 儿 时 的 童 证 , “一 去 二 三 里 ， 烟 村 四 五 家 。 字 合 
六 七 座 ， 八 九 十 文化 。 ”2 和 3 是 最 基本 的 阿拉 伯 数 字 ， 用 它们 来 命名 一 
种 树 结 构 ， 显 然 是 说 明 这 种 结构 与 数字 2 和 3 有 密切 关系 。 


2-3) EIN RS REO: 其 中 的 每 一 个 结 点 都 具有 两 个 孩子 
(我 们 称 它 为 2 结 点 ) 或 三 个 孩子 (我 们 称 它 为 3 结 点 ) ° 


一 个 2 结 点 包含 一 个 元 素 和 两 个 孩子 (或 没有 孩子 ，， 且 与 二 又 排序 树 
类 似 ， 左 子 树 包 含 的 元 素 小 于 该 元 素 ， 右 子 树 包含 的 元 素 大 于 该 元 
素 。 不 过 ， 与 二 又 排序 树 不 同 的 是 ， 这 个 2 结 点 要 么 没有 孩子 ， 要 有 就 
有 两 个 ， 不 能 只 有 一 个 孩子 。 


一 个 3 结 点 包含 一 小 一 大 两 个 元 素 和 三 个 孩子 〈 或 没有 孩子 ) ， 一 个 3 
结 点 要 么 没有 孩子 ， 要 么 具有 3 个 孩子 。 如 肝 某 个 3 结 点 有 孩子 的 话 ， 
左 子 树 包含 小 于 较 小 元 素 的 元 素 ， 右 子 树 包 含 大 于 较 大 元 素 的 元 素 ， 
中 间 子 树 包含 介 于 两 元 素 之 间 的 元 素 。 


并 且 2-3 树 中 所 有 的 叶子 都 在 同一 层次 上 。 如 图 8-8-2 所 示 ， 职 是 一 棵 有 
效 的 2-3 树 。 


事实 上 ，2-3 树 复杂 的 地 方 就 在 于 新 结 点 的 插入 和 已 有 结 点 的 删除 。 毕 
竟 ， 每 个 结 点 可 能 是 2 结 点 也 可 能 是 3 结 点 ， 要 保证 所 有 叶子 都 在 同一 
层次 ， 是 需要 进行 一 番 复 杂 操 作 的 。 


MER 有 一 个 元 素 8 和 两 个 子 树 ， Ἂ 
ETRWNTS, ATH MATE κ rA ERATED, M 


i HEATA, ETAO. 10 


Γ 小 于 2 在 树 大 于 14， 
| PRIA F125 14219 


Perr rrr 


LAH THEA 


图 8-8-2 

1. 2-3 树 的 插入 实现 

对 于 2-3 树 的 插入 来 说 ， 与 二 又 排序 树 相 同 ， 揪 入 操作 一 定 是 发 生 在 叶 
子 结 点 上 。 可 与 二 又 排 序 树 不 同 的 是 ，2-3 树 插入 一 个 元 素 的 过 程 有 可 
能 会 对 该 树 的 其 余 结构 产生 连锁 反应 。 

2-3 树 插入 可 分 为 三 种 情况 。 

1) 对 于 空 树 ， 插 入 一 个 2 结 点 即 可 ， 这 很 容易 理解 。 

2) 插入 结 点 到 一 个 2 结 点 的 叶子 上 。 应 该 说 ， 由 于 其 本 身 就 只 有 一 个 
元 素 ， 所 以 只 需要 将 其 升级 为 3 结 点 即 可 。 如 图 8-8-3 所 示 。 我 们 希望 从 


左 图 的 2-3 树 中 插入 元 素 3， 根 据 遍 历 可 知 ，3 比 8 小 、 比 4 小 ， 于 十 就 只 
能 考虑 插入 到 叶子 结 点 1 所 在 的 位 置 ， 因 此 很 目 然 的 想法 束 是 将 此 绪 点 


δρ AIE, MAREEA ERIE «34, MEATA 
当前 叶子 结 点 的 元 素 比 较 大 小 后 ， 决 定 谁 在 左 谁 在 右 。 例 如 ， 者 插入 
的 是 0， 则 此 结 点 就 是 “0” 在 左 “1” 在 右 了 。 


图 8-8-3 


3) 要 往 3 结 点 中 插入 一 个 新 元 素 。 因 为 3 结 点 本 身 已 经 是 2-3 树 的 结 点 最 
大 容量 (已 经 有 两 个 元 素 ) ， 因 此 就 需要 将 其 拆 分 ， 且 将 树 中 两 元 素 
; απ 中 选择 其 一 同上 移动 一 层 。 复 杂 的 情况 也 正在 于 


第 一 种 情况 ， 见 图 8-8-4， 需 要 向 左 几 中 插入 元 素 5。 经 过 遍历 可 得 到 元 
素 5 比 8 小 比 4 大 ， 因 此 它 应 该 是 需要 插入 在 拥有 6、7 元 素 的 3 结 点 位 

置 。 问 题 就 在 于 ，6 和 7 结 点 已 经 是 3 结 点 ， 不 能 再 加 。 此 时 发 现 它 的 双 
亲 结 点 4 是 个 2 结 点 ， 因 此 考虑 让 它 升 级 为 3 结 点 ， 这 样 它 就 得 有 三 个 孩 
子 ， 于 是 就 想到 ， 将 6、7 结 点 拆 分 ， 让 6 与 4 结 成 3 结 点 ， 将 5 成 为 它 的 
中 间 和 孩子， 将 7 成 为 它 的 右 孩 和子， 如 图 8-8-4 的 右 图 所 示 。 


图 8-8-4 


另 一 种 情况 ， 如 图 8-8-5 所 示 ， 需 要 癌 左 图 中 揪 入 元 素 11。 经 过 遍历 可 
得 到 元 素 11 比 12、14 小 比 9、10 大 ， 因 此 它 应 该 是 需要 插入 在 拥有 9、 
10 元 素 的 3 结 点 位 置 。 同 样 道 理 ，9 和 10 结 点 不 能 再 增加 结 点 。 此 时 发 
现 它 的 双亲 结 点 12、14 也 是 一 个 3 结 点 ， 也 不 能 再 插入 元 素 了 。 再 往 上 
看 ，12、14 结 点 的 双亲 ， 结 点 8 是 个 2 结 点 。 于 是 就 想到 ， 将 9、10 拆 
分 ，12、14 也 拆 分 ， 让 根 结 点 8 升级 为 3 结 点 ， 最 终 形 成 如 图 8-8-5 的 右 
图 样子 。 


图 8-8-5 


再 来 看 个 例子 ， 如 图 8-8-6 所 示 ， 需 要 在 左 图 中 插入 元 素 2。 经 过 遍历 可 
得 到 元 素 2 比 4 小 、6 比 1 大 ， 因 此 它 应 该 是 需要 插入 在 拥有 1、3 元 素 的 3 
结 点 位 置 。 与 上 例 一 样 ， 你 会 发 现 ，1、3 结 点 ，4、6 结 点 都 是 3 结 点 ， 
都 不 能 再 插入 元 素 了 ， 再 往 上 看 ，8、12 结 点 还 是 一 个 3 结 点 ， 那 就 意 
味 着 ， 当 前 我 们 的 树 结构 是 三 层 已 经 不 能 满足 当前 结 点 增加 的 需要 

了 。 于 是 将 1、3 拆 分 ，4、6 拆 分 ， 连 根 结 点 8、12 也 拆 分 ， 最 终 形 成 如 
图 8-8-6 的 右 图 样子 。 


图 8-8-6 


通过 这 个 例子 ， 也 让 我 们 发 现 ， 如 果 2-3 树 插入 的 传播 效应 导致 了 根 结 
点 的 拆 分 ， 则 树 的 高 度 就 会 增加 。 

2. 2-3 树 的 删除 实现 

对 于 2-3 树 的 删除 来 说 ， 如 果 对 前 面 插入 的 理解 足够 到 位 的 话 ， 应 该 不 
是 难事 了 。2-3 树 的 删除 也 分 为 三 种 情况 。 与 插入 相反 ， 我 们 从 3 结 点 开 
台 说 起 。 

1) 所 删除 元 素 位 于 一 个 3 结 点 的 叶子 结 点 上 ， 这 非常 简单 ， 只 需要 在 


该 结 扣 处 删除 该 元 素 即 可 ， 不 会 影响 到 整 棵 树 的 其 他 结 点 结构 。 如 图 8- 
8-7 所 示 ， 删 除 元 素 9， 只 需要 将 此 结 点 改 成 只 有 元 素 10 的 2 结 点 即 可 。 


图 8-8-7 


2) 所 删除 的 元 素 位 于 一 个 2 结 点 上 ， 即 要 删除 的 是 一 个 只 有 一 个 元 素 
的 结 点 。 如 来 按照 以 前 树 的 理解 ， 删 除 即 可 ， 可 现在 的 2-3 树 的 定义 告 
诉 我 们 这 样 做 是 不 可 以 的 。 比 如 图 8-8-8 所 示 ， 如 果 我 们 删除 了 结 点 1 
να πα ( 它 拥有 两 个 孩子 ) ， 此 时 它 就 不 满足 定 
NT 
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图 8-8-8 
因此 ， 对 于 删除 叶子 是 2 结 点 的 情况 ， 我 们 需要 分 四 种 情形 来 处 理 。 


情形 一 ， 此 绪 点 的 双亲 也 是 2 结 点 ， 且 拥有 一 个 3 绪 点 的 右 孩 子 。 如 图 8- 
8-9 所 示 ， 删 除 结 点 1， 那 么 只 需要 左旋 ， 即 6 成 为 双亲 ，4 成 为 6 的 左 孩 
Te 71ΕΘΗΗΗ ΥΓ 5 


图 8-8-9 


情形 二 ， 此 结 点 的 双 莱 是 2 结 点 ， 它 的 右 孩 子 也 是 2 结 点 。 如 图 8-8-10 所 
示 ， 此 时 删除 结 点 4， 如 果 直 接 左旋 会 造成 没有 右 孩 子 ， 因 此 需要 对 整 
棵 树 变形 ， 办 法 就 是 ， 我 们 目标 是 让 结 点 7 变 成 3 结 点 ， 那 就 得 让 比 7 稍 
大 的 元 素 8 下 来 ， 随 即 束 得 让 比 元 素 8 稍 大 的 元 素 9 补 充 结 点 8 的 位 置 ， 

于 是 束 有 了 图 8-8-10 的 中 间 图 ， 于 是 再 用 左旋 的 方式 ， 变 成 右 图 结 琳 。 


图 8-8-10 


187 --. LER A ΚΕἼ 3ἑῆπ. 。 如 图 8-8-11 所 示 ， 此 时 删除 结 点 
10， 意 味 着 双亲 12、14 这 个 结 点 不 能 成 为 3 结 点 了 ， 于 是 将 此 结 点 拆 
分 ， 并 将 12 与 13 合 并 成 为 左 孩 子 。 


图 8-8-11 


情形 四 ， 如 果 当 前 树 是 一 个 满 二 又 树 的 情况 ， 此 时 删除 任何 一 个 叶子 
都 会 使 得 整 棵 树 不 能 满足 2-3 树 的 定义 。 如 图 8-8-12 所 示 ， 删 除 叶 子 结 
点 8 时 (其 实 删 除 任何 一 个 结 点 都 一 样 》 ， 就 不 得 不 考虑 要 将 2-3 的 层 数 
减少 ， 办 法 是 将 8 的 双亲 和 其 左 子 树 6 合 并 为 一 3 个 结 点 ， 再 将 14 与 9 合 
并 为 3 结 护 ， 最 后 成 为 右 图 的 样子 。 


图 8-8-12 


3) 所 删除 的 元 素 位 于 非 叶 子 的 分 支 结 点 。 此 时 我 们 通常 是 将 树 按 中 序 
过 历 后 得 到 此 元 素 的 前 驱 或 后 继 元 素 ， 考 虑 让 它们 来 补 位 即 可 。 


如 朱 我 们 要 删除 的 分 文 结 点 是 2 结 点 。 如 图 8-8-13 所 示 我 们 要 删除 4 绩 
后， 分 析 后 得 到 它 的 前 驱 是 1 后 继 是 6， 显 然 ， 由 于 6、7 是 3 结扎 ， 只 需 
要 用 6 来 补 位 即 可 ， 如 图 8-8-13 右 图 所 示 。 


图 8-8-13 


HOARE SR Sc ete ASE ICR, ἄμΕβΘ-8-14ΛΤΡΝΦΕ/ΠΙ 
要 删除 12、14 结 点 的 12， 此 时 ， 经 过 分 析 ， 显 然 应 该 古 将 是 3 结 点 的 左 
孩子 的 10 上 升 到 删除 位 置 合 适 。 


图 8-8-14 


当 伏 ， 如 有 果 对 2-3 树 的 插入 和 删除 等 所 有 的 情况 进行 讲解 ， 既 占 篇 幅 ， 
又 没 必要 ， 总 的 来 说 它 是 有 规律 的 ， 需 要 你 们 在 上 面 的 这 些 例子 中 多 
去 体会 后 掌握 。 


8.8.2 ”2-3-4 树 


有 了 2-3 树 的 讲解 ，2-3-4 树 就 很 好 理解 了 ， 它 其 实 就 是 2-3 树 的 概念 扩 
展 ， 包 括 了 4 结 点 的 使 用 。 一 个 4 结 点 包含 小 中 大 三 个 元 素 和 四 个 孩子 
(或 没有 孩子 ) ， 一 个 4 结 点 要 么 没有 孩子 ， 要 么 具有 4 个 孩子 。 如 果 
某 个 4 结 点 有 孩子 的 话 ， 左 于 树 包含 小 于 最 小 元 素 的 元 素 ; 第 二 子 树 包 
含 大 于 最 小 元 素 ， 小 于 第 二 元 素 的 元 素 ; 第 三 子 树 包含 大 于 第 二 元 
素 ， 小 于 最 大 元 和 聚 的 元 素 ; 右 子 树 包 含 大 于 最 大 元 素 的 元 素 。 


由 于 2-3-4 树 和 2-3 树 是 类 似 的 ， 我 们 这 里 就 简单 介绍 一 下 ， 如 果 我 们 构 
建 一 个 数组 为 {7,1,2,5,6,9,8,4,3} 的 2-3-4 树 的 过 程 ， 如 图 8-8-15 所 示 。 图 1 
是 在 分 别 插入 7、1、2 时 的 结果 图 ， 因 为 3 个 元 素 满 足 2-3-4 树 的 单个 4 结 
点 定义 ， 因 此 此 时 不 需要 拆 分 ， 接 着 插入 元 素 5， 因 为 已 经 超过 了 4 结 
点 的 定义 ， 因 此 拆 分 为 图 2 的 形状 。 之 后 的 图 其 实 就 是 在 元 素 不 断 插 入 
时 最 后 形成 了 图 7 的 2-3-4 树 ° 
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图 8-8-15 


图 8-8-16 是 对 一 个 2-3-4 树 的 删除 结 点 的 演变 过 程 ， 删 除 顺 序 是 1、6、 
3、4、5、2、9 。 
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图 8-8-16 


8.8.3 ΒΛ 


我 们 本 市 名 称 叫 B 树 ， 但 到 了 现在 才 开 始 提 到 它 ， 似 乎 这 主角 出 来 的 实 
在 太 晚 了 ， 可 其 实 ， 我 们 前 面 一 直 部 在 讲 B 树 。 


B 树 (B-tree) 是 一 种 平衡 的 多 路 查找 树 ，2-3 树 和 2-3-4 树 都 是 B 树 的 特 
例 。 结 点 最 大 的 孩子 数目 称 为 B 树 的 阶 (order) ， 因 此 ，2-3 树 是 3 阶 B 
树 ，2-3-4 树 是 4 阶 B 树 。 
一 个 m 阶 的 B 树 具有 如 下 属性 : 
ο 如 果 根 结 点 不 是 叶 结 点 ， 则 其 至 少 有 两 棵 子 树 。 
。 每 一 个 非 根 的 分 支 结 点 都 有 k-1 个 元 素 和 k 个 孩子 ， 其 中 。 每 一 个 时 
子 结 点 n 都 有 k-1 个 元 素 ， 其 中 。 


。 所 有 时 了 于 结 点 都 位 于 同一 层次 。 
。 所 有 分 文 结 点 包含 下 列 信息 数据 


(nA ΚΑ! Κ.Α... K AL) ， 其 中 : K,(i=1,2,... WAKES, 
AK, <K į G=1,2,..,n-1); AiG=0,2Dn) 为 指向 子 树 根 结 点 的 指针 ， 且 
指针 Ai 所 指 子 树 中 所 有 结 扩 的 关键 字 均 小 于 Ki;(i=1,2,.…n)，An 所 指 
于 树 中 所 有 结 点 的 关键 字 均 大 于 Ku ，n(sn<m-1) 为 关键 字 的 个 数 (或 
n+1 为 子 树 的 个 数 ) 。 

例如 ， 在 讲 2-3-4 树 时 插入 9 个 数 后 的 图 转 成 B 树 示意 就 如 图 8-8-17 的 右 
图 所 示 。 左 侧 灰 色 方 块 表示 当前 结 点 的 元 素 个 数 。 
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图 8-8-17 


在 B 树 上 查找 的 过 程 是 一 个 顺 指 针 查 找 结 点 和 在 结 点 中 查找 关键 字 的 交 
又 过 程 。 

比方 说 ， 我 们 要 查找 数字 7， 首 先 从 外 存 《比如 硬盘 中 ) 读 取得 到 根 结 
点 3、5、8 三 个 元 素 ， 发 现 7 不 在 当中 ， 但 在 5 和 8 之 间 ， 因 此 就 通过 A， 
再 读 取 外 存 的 6、7 结 点 ， 查 找到 所 要 的 元 素 。 

至 于 B 树 的 插入 和 删除 ， 方 式 是 与 2-3 树 和 2-3-4 树 相 类 似 的 ， 只 不 过 阶 
数 可 能 会 很 大 而 已 。 

我 们 在 本 市 的 开头 提 到 ， 如 果 内 存 与 外 存 交 换 数 据 次 数 频 繁 ， 会 造成 
了 时 间 效 率 上 的 瓶 贷 ， 那 么 B 树 结构 怎么 就 可 以 做 到 减少 次 数 呢 ? 
我 们 的 外 存 ， 比 如 硬盘 ， 是 将 所 有 的 信息 分 割 成 相等 大 小 的 页 面 ， 
次 硬盘 读 写 的 都 是 一 个 或 多 个 完整 的 页 面 ， 对 于 一 个 硬盘 来 说 ， 一 页 
的 长 度 可 能 是 211 到 214 个 字 节 ο 


在 一 个 典型 的 B 树 应 用 中 ， 要 处 理 的 人 硬盘 数据 量 很 大 ， 因 此 无 法 一 次 全 
部 装 入 内 存 。 因 此 我 们 会 对 B 树 进行 调整 ， 使 得 B 树 的 阶 数 (或 结 点 的 
元 素 ) 与 硬盘 存储 的 页 面 大 小 相 匹配 。 比 如 说 一 棵 B 树 的 阶 为 1001 (8Η 
1 个 结 点 包含 1000 个 关键 字 ) ， 高 度 为 2， 它 可 以 储存 超过 10 亿 个 关键 
字 ， 我 们 只 要 让 根 结 点 持久 地 傈 留 在 内 存 中 ， 那 么 在 这 柠 树 上 ， 寻 找 
某 一 个 关键 字 至 多 需要 两 次 硬盘 的 读 取 即 可 。 这 就 好 比 我 们 普通 人 数 
钱 剖 是 一 张 一 张 的 数 ， 而 银行 职员 数 钱 则 十 五 张 、 十 张 ， 甚 至 几 十 张 
一 数 ， 速 度 当然 是 比 常 人 快 了 不 少 。 


通过 这 种 方式 ， 在 有 限 内 存 的 情况 下 ， 每 一 次 磁盘 的 访问 我 们 都 可 以 

获得 最 大 数量 的 数据 。 由 于 B 树 每 结 点 可 以 具有 比 二 义 树 多 得 多 的 元 

素 ， 所 以 与 二 义 树 的 操作 不 同 ， 它 们 减少 了 必须 访问 结 点 和 数据 块 的 

ο ο ΘΙ ος 
交互 准备 的 。 


那么 对 于 n 个 关键 子 的 m 阶 B 人 网， 最 环 人 情况 征 要 查找 儿 次 呢 7 我 们 来 作 
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第 一 层 至 少 有 1 个 结 点 ， 第 二 层 至 少 有 2 个 结 点 ， 由 于 除根 结 点 外 每 个 
分 支 结 点 至 少 有 |my/2| 棵 子 树 ， 则 第 三 层 至 少 有 2x|my/2| 个 结 点 ，.……….， 
这 样 第 k+1 层 至 少 有 2x(|m/2) ce 个 结 点 ， 而 实际 上 ，k+1 层 的 结 点 就 是 
叶子 结 点 。 知 m 阶 B 树 有 n 个 关键 字 ， 那 么 当 你 找到 了 叶子 结 点 ， 其 实 
也 就 等 于 查找 不 成 功 的 结 点 为 n+1， 因 此 n+1>2x(|m/2I) t, ΗΠ: 


Nt 
Slog. | — + 
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也 就 是 说 ， 在 含有 n 个 关键 字 的 B 树 上 查找 时 ， 从 根 结 点 到 关键 字 结 点 
的 路 径 上 涉及 的 结 点 数 不 超 过 log m ((n+1)/2)+1 ° 


8.8.4 B+ 树 


尽管 前 面 我 们 已 经 讲 了 B 树 的 诸多 好 处 ， 但 其 实 它 还 是 有 缺陷 的 。 对 于 
树 结构 来 说 ， 我 们 都 可 以 通过 中 序 遇 历来 顺序 查找 树 中 的 元 素 ， 这 一 
DBE TEA TE FIAT ° 


可 是 在 B 树 结构 中 ， 我 们 往返 于 每 个 结 点 之 间 也 就 意味 着 ， 我 们 必须 得 
在 人 硬 檀 的 页 面 之 间 进 行 多 次 访问 ， 如 图 8-8-18 所 示 ， 我 们 希望 遍历 这 标 
B 树 ， 假 设 每 个 结 点 都 属于 人 硬盘 的 不 同 页 面 ， 我 们 为 了 中 序 遍 历 所 有 的 
元 素 ， 页 面 2-» nA- 页面 3 一 页 面 1» 页 面 4~ ΠΙ ΠΗ1 -» 页 面 5。 而 且 我 
们 每 次 经 过 结 点 遍历 时 ， 都 会 对 结 点 中 的 元 素 进 行 一 次 遍历 ， 这 就 非 
常 糟糕 。 有 没有 可 能 让 饥 历时 每 个 元 素 只 访问 一 次 呢 ? 
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图 8-8-18 


为 了 说 明 这 个 解决 的 办 法 ， 我 举 个 例子 。 一 个 优秀 的 企业 尽管 可 能 
非常 成 熟 的 树 状 组 织 结构 ， 但 是 这 并 不 意味 着 员工 也 很 满意 ， 恰 恰 相 
反 ， 由 于 企业 管理 更 多 考虑 的 是 企业 的 利益 ， 这 束 容 易 忽略 员工 的 各 
种 诉求 ， 造 成 了 管理 者 与 员工 之 间 的 矛盾 。 正 因为 此 ， 工 会 束 产 生 
了 ， 工 会 原意 是 指 基于 共同 利益 而 自发 组 织 的 社会 团体 。 这 个 共同 利 
益 团 体 诸 如 为 同一 雇主 工作 的 员工 ， 在 某 一 产业 领域 的 个 人 。 工 会 组 
织 成 立 的 主要 作用 ， 可 以 与 雇主 谈判 工 次 薪水、 工作 时 限 和 工作 条 件 
等 。 这 样 ， 其 实在 整个 企业 的 运转 过 程 中 ， 除 了 正规 的 层级 管理 外 ， 
还 有 一 个 代表 员工 的 团队 在 发 挥 另外 的 作用 。 


同样 的 ， 为 了 能 够 解决 所 有 元 素 遍 历 等 基本 问题 ， 我 们 在 原 有 的 B 树 结 
构 基 础 上 ， 加 上 了 新 的 元 素 组 织 方 式 ， 这 束 是 B+ 树 。 


B+ 树 是 应 文件 系统 所 需 而 出 的 一 种 B 树 的 变形 树 ， 注 意 产 格 意义 上 
讲 ， 它 其 实 已 经 不 是 第 六 章 定义 的 树 了 。 在 B 树 中 ， 每 一 个 元 素 在 该 树 
中 只 出 现 一 次 ， 有 可 能 在 叶子 结 护 上， 也 有 可 能 在 分 文 结 点 上 。 而 在 
B+ 树 中 ， 出 现在 分 支 结 点 中 的 元 素 会 被 当 作 它 们 在 该 分 支 结 扩 位置 的 
中 序 后 继 者 (叶子 结 点 ) 中 再 次 列 出 。 男 外 ， 每 一 个 叶子 结 点 都 会 保 
存 一 个 指 癌 后 一 叶子 结 点 的 指针 5 


例如 图 8-8-19 所 示 ， 就 是 一 棵 B+ 树 的 示意 ， 灰 色 关 键 字 即 是 根 结 点 中 
的 关键 字 在 叶子 结 点 再 次 列 出 ， 并 且 所 有 叶子 结 点 都 链接 在 一 起 。 


图 8-8-19 
一 棵 m 阶 的 B+ 树 和 m 阶 的 B 树 的 差异 在 于 : 
。 有 n 棵 子 树 的 结 点 中 包含 有 n 个 关键 字 ; 


。 所 有 的 叶子 结 点 包含 全 部 关键 字 的 信息 ， 及 指向 舍 这 些 关 键 子 记 
录 的 指针 ， 叶 子 结 点 本 身 依 关键 字 的 大 小 自 小 而 大 顺序 链接 ，; 


。 所 有 分 文 结 点 可 以 看 成 是 索引 ， 结 点 中 仅 含 有 其 子 树 中 的 最 大 
(或 最 小 ) 关键 字 。 


这 样 的 数据 结构 最 大 的 好 处 束 在 于 ， 如 来 古 要 随机 查找 ， 我 们 束 从 根 
结 点 出 发 ， 与 B 树 的 得 找 方式 相同 ， 只 不 过 即使 在 分 文 结扎 找到 了 待 得 
找 的 关键 字 ， 它 也 只 走 用 来 索引 的 ， 不 能 提供 实际 记录 的 访问 ， 还 是 
需要 到 达 包 含 此 关键 字 的 终端 结 点 。 


如 采 我 们 十 需要 从 最 小 关键 子 进行 从 小 到 大 的 顺序 查找 ， 我 们 就 可 以 
从 最 左 侧 的 时 子 结 点 出 发 ， 不 经 过 分 文 结 点 ， 而 是 延 痢 指 癌 下 一 叶子 
的 指针 就 可 裔 历 所 有 的 关键 子 。 


B+ 树 的 结构 特别 适合 珊 有 范围 的 查找 。 比 如 查找 我 们 学 校 18 一 22 罗 的 
学 生 人 数 ， 我 们 可 以 通过 从 根 结 总 出 发 找到 第 一 个 18 罗 的 学 生 ， 然 后 
再 在 叶子 结 点 按 顺 序 查找 到 符合 范围 的 所 有 记录 。 


B+ 树 的 插入 、 删 除 过 程 也 都 与 B 树 类 似 ， 只 不 过 插入 和 删除 的 元 系 都 
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8.9” 散 列表 查找 (ABR) 概述 


在 本 章 前 面 的 顺序 表 查 找 时 ， 我 们 曾经 说 过 ， 如 果 你 要 查找 某 个 关键 
字 的 记录 ， 就 是 从 表 头 开始 ， 挨 个 的 比较 记录 af 与 key 的 值 是 “=” 还 
是 “zx"”， 直 到 有 相等 才 算 是 查找 成 功 ， 返 回 i。 到 了 有 序 表 查找 时 ， 我 们 
可 以 利用 a[ 与 key 的 “<” 或 “>” 来 折 半 查找 ， 直 到 相等 时 查找 成 功 返回 
i。 最 终 我 们 的 目的 都 是 为 了 找到 那个 :， 其 实 也 就 是 相对 的 下 标 ， 再 通 
过 顺序 存储 的 存储 位 置 计算 方法 ，LOC(a;)=LOC(aj ) 十 (i-1)xc， 也 就 
. 元素 内 存 存 储 位 置 加 上 i-1 个 单元 位 置 ， 得 到 最 后 的 内 存 


此 时 我 们 发 现 ， 为 了 查找 到 结果 ， 之 前 的 方法 “比较 ”都 是 不 可 避免 
的 ， 但 这 是 否 真 的 有 必要 ? 能 否 直 接 通 过 关键 子 key 得 到 要 查找 的 记录 
内 存 存储 位 置 呢 ? 

8.9.1 BURAK EL 


试想 这 样 的 场景 ， 你 很 想 学 太极 拳 ， 听 说 学 校 有 个 叫 张三丰 的 人 打 得 
特别 好 ， 于 是 你 到 学 校 学 生 处 找 人 ， 学 生 处 的 工作 人 员 可 能 会 拿 出 学 


生 名 和 单 ， 一 个 一 个 的 但 找 ， 最 终 告 诉 你 ， 学 校 没 这 个 人 ， 并 说 张三丰 
几 百 年 前 束 已 经 在 武当 山 作 二 了。 可 如 采 你 找 对 了 人 ， 比 如 在 操场 上 
找 那 些 爱 运动 的 同学 ， 人 家 会 告诉 你 ，“ 哦 ， 你 找 张三丰 呀 ， 有 有 有 ， 

我 带 你 去 。” 于 是 他 把 你 带 到 了 体育 馆 内 ， 并 告诉 你 ， 那 个 教 大 家 打 太 
ο ο. 征 “ 张 三 丰 ”， 原 来 "张三丰 ?是 因为 他 太极 攀 打 得 好 而 得 到 
y wy Ὁ 


ΤΗ | 
[5 


图 8-9-1 


学 生 处 的 老师 找 张 三 丰 ， 那 就 是 顺序 表 碍 找 ， 依 赖 的 是 姓名 关键 字 的 
比较 。 而 通过 爱好 运动 的 同学 询问 时 ， 没 有 遇 历 ， 没 有 比较 ， 就 插 他 
们 “ 欲 找 太极 张三丰 '， 必 在 体育 馆 当 中 ”的 经 验 ， 直 接 告 诉 你 位 置 。 


也 就 是 说 ， 我 们 只 需要 通过 某 个 函数 f， 使 得 


存储 位 置 =f (关键 字 ) 


那样 我 们 可 以 通过 查找 关键 字 不 需要 比较 台 可 获得 需要 的 记录 的 存储 
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散 列 技术 是 在 记录 的 存储 位 置 和 它 的 关键 字 之 间 建 立 一 个 确定 的 对 应 
关系 f， 使 得 每 个 关键 字 key 对 应 一 个 存储 位 置 {f (key) 。 查 找 时 ， 根 据 
这 个 确定 的 对 应 关系 找到 给 定 值 key 的 映射 f (key) ， 若 查找 集合 中 存 
在 这 个 记录 ， 则 必定 在 f (key) 的 位 置 上 。 


这 里 我 们 把 这 种 对 应 关系 f 称 为 散 列 函 数 ， 又 称 为 哈 硕 (Hash) χο 
按 这 个 思想 ， 采 用 散 列 技术 将 记录 存储 在 一 块 连续 的 存储 空间 中 ， 这 
块 连续 存储 空间 称 为 散 列 表 或 哈 希 表 (Hash table) 。 那 么 关键 字 对 应 
的 记录 存储 位 置 我 们 称 为 散 列 地 址 。 


8.9.2” 散 列表 查找 步骤 


整个 散 列 过 程 其 实 就 是 两 步 。 (1) 在 存储 时 ， 通 过 散 列 函数 计算 记录 
的 散 列 地 址 ， 并 按 此 散 列 地 址 存储 该 记录 。 就 像 张三丰 我 们 就 让 他 在 
体育 馆 ， 那 如 果 是 ' 爱 因 斯 坦 ' 我 们 让 他 在 图 书馆 ， 如 果 是 “大 里 夫人 人 ;， 
那 就 让 她 在 化 学 实验 室 ， 如 果 是 “巴顿 将 军 *， 这 个 打仗 的 将 军 一 一 我 们 
可 以 让 他 到 网 吧 。 总 之 ， 不 管 什么 记录 ， 我 们 都 需要 用 同一 个 散 列 函 
数 计算 出 地 址 再 存储 。 


图 8-9-2 (2) 当 查 找 记 录 时 ， 我 们 通过 同样 的 散 列 函数 计算 记录 的 散 列 
地 址 ， 按 此 散 列 地 址 访问 该 记录 。 说 起 来 很 简单 ， 在 哪 存 的 ， 上 哪 去 
找 ， 由 于 存 取 用 的 是 同一 个 散 列 钞 数 ， 因 此 结 琳 当 然 也 是 相同 的 。 


所 以 说 ， 获 列 技术 既是 一 种 存储 方法 ， 也 是 一 种 查找 方法 。 然 而 它 与 
线性 表 、 树 、 岁 等 结构 不 同 的 是 ， 前 面 儿 种 结构 ， 数 据 元 素 之 间 都 存 
在 某 种 逻辑 关系 ， 可 以 用 连 线 图 示 表 示 出 来 ， 而 散 列 技术 的 记录 之 同 
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查找 的 存储 结构 。 


散 列 技术 最 适合 的 求解 问题 是 查找 与 给 定 值 相等 的 记录 。 对 于 查找 来 
说 ， 休 化 了 比较 过 程 ， 戏 率 束 会 大 大 提高 。 但 万 事 有 利 束 有 兹 ， 获 列 
技术 不 具备 很 多 常规 数据 结构 的 能 力 。 


比如 那 种 同样 的 关键 字 ， 它 能 对 应 很 多 记录 的 情况 ， 却 不 适合 用 散 列 
技术 。 一 个 班级 几 十 个 学 生 ， 他 们 的 性 别 有 男 有 女 ， 你 用 关键 

字 男 * 去 查找 ， 对 应 的 有 许多 学 生 的 记录 ， 这 显然 是 不 合适 的 。 只 有 
如 用 班级 学 生 的 学 号 或 者 身份 证 号 来 散 列 存储 ， 此 时 一 个 号 码 唯一 对 
应 一 个 学 生 才 比 较 合适 。 


同样 散 列表 也 不 适合 范围 查找 ， 比 如 查找 一 个 班级 18 一 22 乡 的 同学 ， 
在 散 列 表 中 没 法 进行 。 想 获得 表 中 记录 的 排序 也 不 可 能 ， 像 最 大 值 、 
最 小 值 等 结 末 也 都 无 法 从 敌 列 表 中 计算 出 来 。 


我 们 说 了 这 么 多 ， 散 列 函数 应 该 如 何 设计 ? 这 个 我 们 需要 重点 来 讲 
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中 最 关键 的 问题 。 


另 一 个 问题 是 冲突 。 在 理想 的 情况 下 ， 每 一 个 关键 字 ， 通 过 散 列 函数 
计算 出 来 的 地 址 都 是 不 一 样 的 ， 可 现实 中 ， 这 只 是 一 个 理想 。 我 们 时 
fe SHE! IN S$ REF key 1 zkey ， ， 但 是 却 有 f(key 1 )=f(key，)， 这 种 现 
象 我们 称 为 冲突 (colli-sion) ， 并 把 key | 和 key , 称 为 这 个 散 列 函数 的 
同义词 (synonym) 。 出 现 了 冲突 当然 非常 糟糕 ， 那 将 造成 数据 查找 错 
误 。 尽 管 我 们 可 以 通过 精心 设计 的 散 列 函数 让 神 突 尽 可 能 的 少 ， 但 是 
不 能 完全 避免 。 于 是 如 何 处 理 冲 突 束 成 了 一 个 很 重要 的 课题 ， 这 在 我 
们 后 面 也 需要 详细 讲解 。 

8.10 ” 散 列 函数 的 构造 方法 

不 管 做 什么 事 要 达到 最 优 都 不 容易 ， 既 要 付出 尽 可 能 的 少 ， 又 要 得 到 
最 大 化 的 多 。 那 么 什么 才 算 是 好 的 散 列 函数 呢 ? 这 里 我 们 有 两 个 原则 
可 以 参考 。 

1. 计算 简单 


ΕΥ ΤΙΣ FT DACRE RY REF EBA oP ETHIE, λε: 
算法 需要 很 复杂 的 计算 ， 会 耗费 很 多 时 间 ， 这 对 于 需要 频繁 地 查找 来 
说 ， 束 会 大 大 降低 查找 的 效率 了 。 因 此 获 列 函数 的 计算 时 间 不 应 该 超 
过 其 他 查找 技术 与 天 键 子 比较 的 时 间 。 


2. 散 列 地 址 分 布 均匀 
我 们 刚才 也 所 到 冲突 市 来 的 问题 ， 最 好 的 办 法 融 是 尽量 让 散 列 地 址 均 


匀 地 分 布 在 存储 空间 中 ， 这 样 可 以 保证 存储 空间 的 有 效 利 用 ， 并 减少 
为 处 理 冲突 而 耗费 的 时 间 。 

授 下 来 我 们 束 要 介绍 几 种 沼 用 的 散 列 函数 构造 方法 。 售 计 设计 这 些 方 
法 的 前 率 们 当年 可 能 是 从 事 间 谍 工 作 ， 因 为 这 些 方 法 都 是 将 原来 数字 
按 某 种 规律 变 成 男 一 个 数 子 而 已 。 


8.10.1 直接 定 址 法 
如 果 我 们 现在 要 对 0~100 岁 的 人 口 数 字 统 计 表 ， 如 表 8-10-1 所 示 ， 那 么 


我 们 对 年 龄 这 个 天 键 字 就 可 以 直接 用 年 龄 的 数字 作为 地 址 。 此 时 
f(key)=key ° 


表 8-10-1 


地 址 ”年龄 人 数 


2020 ”1500 万 


99999999 eeeee。e。ee. 


如 果 我 们 现在 要 统计 的 是 80 后 出 生年 份 的 人 口 数 ， 如 表 8-10-2 所 示 ， 那 
么 我 们 对 出 生年 份 这 个 关键 字 可 以 用 年 份 减 去 1980 来 作为 地 址 。 此 时 


f(key)=key-1980 ο 


表 8-10-2 


地 址 出 生 年 份 人 数 
0 1980 1500 万 
il 1981 16004 
2 1982 13004 


也 束 是 说 ， 我 们 可 以 取 关 键 字 的 某 个 线性 函数 值 为 敌 列 地 址 ， 即 


f(key)=axkey+b (a、b 为 常数 ) 


这 样 的 歼 列 钞 数 优点 束 古 简单 、 均 习 ， 也 不 会 产生 冲突 ， 但 问题 是 这 
需要 事先 知道 关键 字 的 分 布 情况 ， 适 合 查 找 表 较 小 且 连 续 的 情况 。 由 
于 这 样 的 限制 ， 在 现实 应 用 中 ， 此 方法 虽然 商 单 ， 但 却 并 不 各 用。 


8.10.2 ”数字 分 析 法 


如 果 我 们 的 关键 字 是 位 数 较 多 的 数字 ， 比 如 我 们 的 11 位 手机 

号 “130xxxx1234”， 其 中 前 三 位 是 接 入 号 ， 一 般 对 应 不 同 运营 商 公司 的 
子 品牌 ， 如 130 是 联通 如 意 通 、136 是 移动 神州 行 、153 是 电信 等 ， 中 间 
四 位 是 HLR 识 别 号 ， 表 示 用 户 号 的 归属 地 ;， 后 四 位 才 是 真正 的 用 户 
号 ， 如 表 8-10-3 所 示 。 


πο ο μμ” πο ο a ina a i 1 


30χχχχ]234 


易 重复 分 布 太 集 ATHS, T 
中 某 几 个 数字 “月 作 散 列 地 址 


表 8-10-3 


震 我 们 现在 要 存储 某 家 公司 员工 登记 表 ， 如 果 用 手机 号 作为 关键 字 ， 
那么 极 有 可 能 前 7 位 都 是 相 同 的 。 那 么 我 们 选择 后 面 的 四 位 成 为 散 列 地 
址 就 是 不 错 的 选择 。 如 末 这 样 的 抽取 工作 还 是 容易 出 现 冲 突 问题 ， 还 
可 以 对 抽取 出 来 的 数字 再 进行 反 转 (如 1234 改 成 4321) 、 右 环 位 移 
(如 1234 改 成 4123) 、 左 环 位 移 、 甚 至 前 两 数 与 后 两 数 合 加 (如 1234 


改 成 12+34=46) 等 方法 。 总 的 目的 就 是 为 了 提供 一 个 散 列 函数 ， 能 够 
合理 地 将 关键 字 分 配 到 散 列 表 的 各 位 置 。 


这 里 我 们 提 到 了 一 个 关键 词 一 一 抽取 。 抽 取 方 法 是 使 用 关键 字 的 一 部 
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数字 分 析 法 通常 适合 处 理 关键 字 位 数 比较 大 的 情况 ， 如 果 事 先知 道 关 
键 字 的 分 布 且 关 键 字 的 奉 干 位 分 布 较 均 习 ， 束 可 以 考虑 用 这 个 方法 。 


8.10.3 ”平方 取 中 法 


这 个 方法 计算 很 简单 ， 假 设 关键 字 是 1234， 那 么 它 的 平方 就 是 
1522756， 再 抽取 中 间 的 3 位 就 是 227， 用 做 散 列 地 址 。 再 比如 关键 字 是 
4321， 那 么 它 的 平方 就 是 18671041， 抽 取 中 间 的 3 位 就 可 以 是 671， 世 
可 以 是 710， 用 做 散 列 地 址 。 平 方 取 中 法 比较 适合 于 不 知道 关键 字 的 分 
布 ， 而 位 数 又 不 是 很 大 的 情况 。 

8.10.4 tree 

eike ΚΕ MARAD EIR ΑΑΚΊΗΦΤΗ ΑΣ (注意 最 后 一 部 
分 位 数 不 够 时 可 以 短 些 )  ， 然 后 将 这 几 部 分 琶 加 求 和 ， 并 按 散 列 表 表 
长 ， 取 后 几 位 作为 散 列 地 址 。 

比如 我 们 的 关键 字 是 9876543210， 散 列表 表 长 为 三 位 ， 我 们 将 它 分 为 
四 组 ，987|654|321|0， 然 后 将 它们 车 加 求 和 987+654+321+0=1962， 表 求 
后 3 位 得 到 散 列 地 址 为 962。 

有 时 可 能 这 还 不 能 够 保证 分 布 均匀 ， 不 妨 从 一 端 癌 男 一 端 来 回 折 车 后 
对 齐 相 加 。 比 如 我 们 将 987 和 321 反 转 ， 再 与 654 和 0 相 加 ， 变 成 
789+654+123+0=1566， 此 时 散 列 地 址 为 566。 

折 蕉 法 事先 不 需要 知道 关键 字 的 分 布 ， 适 合 关 键 字 位 数 较 多 的 情况 。 
8.10.55 RERE 

ο ος 。 对 于 散 列表 长 为 下 的 散 列 函数 公 
TANS 


f(key)=key mod p(p<m) 


mod 是 取 模 〈 求 余数 ) 的 意思 。 事 实 上 ， 这 方法 不 仅 可 以 对 关键 字 直 接 
取 模 ， 也 可 在 折合 、 平 方 取 中 后 再 取 模 。 


很 显然 ， 本 方法 的 关键 束 在 于 选择 合适 的 p，p 如 有 雪 选 得 不 好 ， 束 可 能 
会 容易 产生 同义词 。 


例如 表 8-10-4， 我 们 对 于 有 12 个 记录 的 关键 字 构 造 散 列 表 时 ， 就 用 了 
να mod 12 的 方法 。 比 如 29 mod 12=5， 所 以 它 存储 在 下 标 为 5 的 
VW. ο 


ΠΒΠΠΕΕΙΕΙΕΙΕΊΕΙΕΙΕΙΓΙΕΙ 


表 8-10-4 


不 过 这 也 是 存在 冲突 的 可 能 的 ， 因 为 12=2x6=3x4。 如 果 关 键 字 中 有 像 
18(3x6)、30(5x6)、42(7x6) 等 数字 ， 它 们 的 余数 都 为 6， 这 就 和 78 所 对 
应 的 下 标 位 置 冲突 了 ο 


甚至 极 兽 一些， 对 于 表 8-10-5 的 关键 子 ， 如 来 我 们 让 p 为 12 的 话 ， 束 可 
ο ο. 所 有 的 关键 字 都 得 到 了 0 这 个 地 址 数 ， 这 未 免 也 太 
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表 8-10-5 
我 们 不 选用 p=12 来 做 除 留 余数 法 ， 而 选用 p=11， 如 表 8-10-6 所 示 “。 
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图 8-10-6 
此 了 驶 只 有 12 和 144 有 冲突 ， 相 对 来 说 ， 就 要 好 很 多 。 


因此 根据 前 辈 们 的 经 验 ， 若 散 列表 表 长 为 中 ， 通 常 p 为 小 于 或 等 于 表 攻 
(最 好 接近 m) 的 最 小 质数 或 不 包含 小 于 20 质 因子 的 合 数 。 


8.10.6 ”随机 数 法 


选择 一 个 随机 数 ， 取 关键 字 的 随机 函数 值 为 它 的 散 列 地 址 。 也 就 十 
f(key)=random(key)。 这 里 random 是 随机 函数 。 当 关键 字 的 长 度 不 等 
时 ， 采 用 这 个 方法 构造 散 列 函数 是 比较 合适 的 。 


有 同学 问 ， 那 如 果 关 键 字 是 字符 串 如 何 处 理 ? 其 实 无 论 是 英文 字符 ， 
还 是 中 文字 符 ， 也 包括 各 种 各 样 的 符号 ， 它 们 都 可 以 转化 为 某 种 数字 
来 对 待 ， 比 如 ASCII 码 或 者 Unicode 码 等 ， 因 此 也 就 可 以 使 用 上 面 的 这 


些 方法 。 


总 之 ， 现 实 中 ， 应 该 视 不 同 的 情况 采用 不 同 的 歼 列 钞 数 。 我 们 只 能 给 
出 一 些 考虑 的 因素 来 提供 参考 : 1. 计 算 散 列 地 址 所 需 的 时 间 。2. 关 键 
字 的 长 度 。 3. 散 列表 的 大 小 。 4. 关 键 字 的 分 布 情况 。 5. 记 录 查 找 的 频 
率 。 综 合 这 些 因素 ， 才 能 决策 克 择 哪 种 散 列 函数 更 合适 。 


8.11 ”处 理 散 列 冲突 的 方法 
我 们 每 个 人 都 希望 身体 健康 ， 虽 然 疾病 能 够 预防 ， 但 是 不 可 避免 ， 没 
有 任何 成 年 人 生 下 来 到 现在 没有 生 过 一 次 病 。 


从 刚才 除 留 余数 法 的 例子 也 可 以 看 出 ， 我 们 设计 得 再 好 的 散 列 轴 数 也 
不 可 能 完全 避免 冲突 ， 这 就 像 我 们 再 健康 也 只 能 尽量 预防 疾病 ， 但 却 
无 法 你 证 永远 不 得 病 一 样 ， 既 然 冲突 不 能 避免 ， 束 要 考虑 如 何 处 理 
ΤΕ ο 
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[κου 1 )=f(key> )， 即 有 神 突 时 ， 怎 么 办 呢 ? 我 们 可 以 从 生活 中 找寻 思 
路 。 


试想 一 下 ， 当 你 观望 很 入 很 入， 终于 看 上 一 套房 打算 要 买 了 ， 正 准备 
下 订金 ， 人 家 告诉 你 ， 这 房子 已 经 被 人 买 走 了 ， 你 怎么 办 9 
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8.11.1 开放 定 址 法 


所 谓 的 开放 定 址 法 就 是 一 旦 发 生 了 冲突 ， 就 去 寻找 下 一 个 空 的 散 列 地 
址 ， 只 要 散 列 表 足 够 大 ， 至 的 散 列 地 址 总 能 找到 ， 并 将 记录 存 入 。 


EM ΠΕ: 


fi (key)=(f(key)+d 1 )ΜΟΡ π(ά 1 =1,2,3,......, m-1) 


比如 说 ， 我 们 的 关键 字 集 合 为 {12,.67,56,16,25,37,22,29,15,47,48,34}， 表 
长 为 12。 我 们 用 散 列 函数 fkey)=key mod 12 5 


当 计 算 前 5 个 数 {12,67,56,16,25} 时 ， 都 是 没有 冲突 的 散 列 地 址 ， 直 接 存 
入 ， 如 表 8-11-1 所 示 。 
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表 8-11-1 


计算 key=37 时 ， 发 现 f(37)=1， 此 时 就 与 25 所 在 的 位 置 冲 突 。 于 是 我 们 
应 用 上 面 的 公式 f(37)=({(37)+1)mod 12=2。 于 是 将 37 存 入 下 标 为 2 的 位 
置 。 这 其 实 就 是 房子 被 人 买 了 于 是 买 下 一 间 的 作法 ， 如 表 8-11-2 所 示 。 


ΠΕ oB ΠΠ. 
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表 8-11-2 


接 下 来 22,29,15,47 都 没有 冲突 ， 正 常 的 存 入 ， 如 表 8-11-3 所 示 。 
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到 了 key=48， 我 们 计算 得 到 f(48)=0， 与 12 所 在 的 0 位 置 冲突 了 ， 不 要 
紧 ， 我 们 f(48)=(f(48)+1)mod 12=1， 此 时 又 与 25 所 在 的 位 置 冲突 。 于 是 
f(48)=(f(48)+2)mod 12=2， 还 是 冲突 ...... 一 直到 f(48)=(f(48)+6)mod 12=6 
时 ， 才 有 空位 ， 机 不 可 失 ， 赶 快 存 入 ， 如 表 8-11-4 所 示 。 
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ΕΗΡΙΠΕΙΠΠΕΙΠΠΕΒΡΙΩ 
表 8-11-4 

我 们 把 这 种 解决 冲突 的 开放 定 址 法 称 为 线性 探测 法 。 

从 这 个 例子 我 们 也 看 到 ， 我 们 在 解决 冲突 的 时 候 ， 还 会 碰 到 如 48 和 37 


这 种 本 来 都 不 是 同义词 却 需要 争夺 一 个 地 址 的 情况 ， 我 们 称 这 种 现象 


为 堆积 。 很 显然 ， 堆 积 的 出 现 ， 使 得 我 们 需要 不 断 处 理 冲突 ， 无 论 是 
人 存 和 人 还 是 查找 效率 都 会 大 大 降低 。 


考虑 深 一 步 ， 如 果 发 生 这 样 的 情况 ， 当 最 后 一 个 key=34，f(key)=10， 

与 22 所 在 的 位 置 冲 突 ， 可 是 22 后 面 没有 空位 置 了 ， 反 而 它 的 前 面 有 一 
个 空位 置 ， 尺 管 可 以 不 断 地 求 余数 后 得 到 结果 ， 但 效率 很 差 。 因 此 我 
Md SD ο ο S q2,-d2,(qsm/2)， 这 样 束 等 于 是 可 以 
双 回 寻找 到 可 能 的 空位 置 。 对 于 34 来 说 ， 我 们 取 d 


=-1 即 可 找到 空位 置 了 。 男 外 增加 平方 运算 的 目的 是 为 了 不 让 关键 子 部 
案 集 在 某 一 块 区 域 。 我 们 称 这 种 方法 为 二 次 探测 法 。 


(EME (Chika obese OD Co (| EA) 


还 有 一 种 方法 是 ， 在 冲突 时 ， 对 于 位 移 量 d ;采用 随机 函数 计算 得 到 ， 
我 们 称 之 为 随机 探测 法 。 


此 时 一 定 有 人 问 ， 既 然 是 随机 ， 那 么 查找 的 时 候 不 也 随机 生成 di 吗 ? 
如 何 可 以 获得 相同 的 地 址 呢 ? 这 是 个 问题 。 这 里 的 随机 其 实 古 伪 随 机 
数 。 伪 随机 数 是 说 ， 如 果 我 们 设置 随机 种 子 相同 ， 则 不 断 调用 随机 画 
数 可 以 生成 不 会 重复 的 数列 ， 我 们 在 查找 时 ， 用 同样 的 随机 种 子 ， 它 
每 次 得 到 的 数列 是 相同 的 ， 相 同 的 di 当然 可 以 得 到 相同 的 散 列 地 址 。 


A? 随机 种 子 又 不 知道 ?” 既 了 里 了 ， 不 慌 的 还 十 去 查阅 资料 吧 ， 我 不 
能 在 读 上 没完 没 了 的 介绍 这 些 基础 知识 呀 。 


H 
f i (key)=(f(key)+d i )MOD m(d 1 是 一 个 随机 数列 ) 


总 之 ， 开 放 定 址 法 只 要 在 散 列表 未 填 满 时 ， 总 是 能 找到 不 发 生 冲 突 的 
地 址 ， 是 我 们 常用 的 解决 冲突 的 办 法 。 
8.11.2 ”再 散 列 函 数 法 


我 们 继续 用 买房 子 来 举例 ， 如 果 你 看 房 时 的 选择 标准 总 是 以 市 中 心 、 
交通 便利 、 价 格 适 中 为 指标 ， 这 样 的 房子 凤毛麟角， 基本 上 当 你 看 到 
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BU ARE, ETS, ZOHR ee, (ES 
便宜 很 多 ， 也 许 房 子 还 可 以 买 得 大 一 些 、 质 量 好 一 些 ， 并 且 由 于 更 换 
了 选 房 的 想法 ， 很 快 束 找 到 了 你 需要 的 房子 了 。 


对 于 我 们 的 做 列表 来 说 ， 我 们 事先 准备 多 个 散 列 函数 。 


f 4 (key)=RH 1 (key)(i=1,2,...,k) 


这 里 RH Bie NAA BO a, πη] EBC BALA TT ZR aR 
数 、 折 释 、 平 方 取 中 全 部 用 上 。 每 当 发 生 散 列 地 址 冲突 时 ， 就 换 一 个 
散 列 画 数 计算 ， 相 信和 总 会 有 一 个 可 以 把 冲突 解决 返 。 这 种 方法 能 够 使 
得 关键 字 不 产生 聚集 ， 当 然 ， 相 应 地 也 增加 了 计算 的 时 间 。 


8.11.3” 链 地 址 法 


思路 还 可 以 再 换 一 换 ， 为 什么 有 冲突 就 要 换 地 方 呢 ， 我 们 直接 束 在 原 
地 想 办 法 不 可 以 吗 ? FERIDA TEINE 5 


将 所 有 关键 字 为 同义词 的 记录 存储 在 一 个 单 链表 中 ， 我 们 称 这 种 表 为 
同义词 子 表 ， 在 散 列 表 中 只 存储 所 有 同义词 子 表 的 头 指针 。 对 于 关键 
字 集 合 {12,67,56,16,25,37,22,29,15,47,48,.34}， 我 们 用 前 面 同 样 的 12 为 除 
数 ， 进 行 除 留 余 数 法 ， 可 得 到 如 图 8-11-1 结 构 ， 此 时 ， 已 经 不 存在 什么 
冲突 换 址 的 问题 ， 无 论 有 多 少 个 冲突 ， 都 只 是 在 当前 位 置 给 单 链表 增 
加 结 点 的 问题 。 
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图 8-11-1 


链 地 址 法 对 于 可 能 会 造成 很 多 冲突 的 散 列 函数 来 说 ， 提 供 了 绝 不 会 出 
现 找 不 到 地 址 的 保障 。 当 然 ， 这 也 就 带 来 了 查找 时 需要 遍历 单 链表 的 
性 能 损耗 。 

8.114 ”公共 溢出 区 法 

这 个 方法 其 实 就 更 加 好 理解 ， 你 不 是 冲突 吗 ? 好 吧 ， 凡 是 冲突 的 都 跟 
我 走 ， 我 给 你 们 这 些 冲突 找 个 地 儿 待 着 。 这 就 如 同 孤 儿 院 收留 所 有 无 


家 可 归 的 孩子 一 样 ， 我 们 为 所 有 冲突 的 关键 字 建 立 了 一 个 公共 的 淤 出 
区 来 存放 。 


束 前 面 的 例子 而 言 ， 我 们 共有 三 个 关键 字 {37,48,34} 与 之 前 的 关键 字 位 
置 有 冲突 ， 那 么 吏 将 它们 存储 到 海 出 表 中 ， 如 图 8-11-2 所 示 。 


alela] 


基本 表 


图 8-11-2 

在 查找 时 ， 对 给 定 值 通过 散 列 函数 计算 出 散 列 地 址 后 ， 先 与 菇 本 表 的 
相应 位 置 进 行 比 对 ， 如 果 相 等 ， 则 查找 成 功 ， 如 果 不 相等 ， 则 到 溢出 
表 去 进行 顺序 查找 。 如 果 相 对 于 基本 表 而 言 ， 有 冲突 的 数据 很 少 的 情 
况 下 ， 公 共 洲 出 区 的 结构 对 查找 性 能 来 说 还 是 非常 高 的 。 

8.12” 散 列表 查找 实现 

说 了 这 么 多 散 列 表 查 找 的 思想 ， 我 们 就 来 看 看 查找 的 实现 代码 。 
8.12.1 ” 散 列 表 查 找 算法 实现 


首先 是 需要 定义 一 个 散 列 表 的 结构 以 及 一 些 相 关 的 常数 。 其 中 
HashTable 融 是 散 列 表 结 构 。 结 构 当 中 的 elem 为 一 个 动态 数组 。 


#define SUCCESS 1 


#define UNSUCCESS 0 


/* 定义 散 列表 长 为 数组 的 长 度 */ 


#define HASHSIZE 12 
#define NULLKEY -32768 
typedef struct 
/* 数据 元 素 存储 基 址 ， 动 态 分 配 数组 */ 


int *elem; 


/* 当前 数据 元 素 个 数 */ 


int count; 


} HashTable; 


/* 散 列 表 表 长 ， 全 后 
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有 了 结构 的 定义 ， 我 们 可 以 对 散 列 表 进 行 初 始 化 。 


/* 初始 化 散 列表 */ 
Status InitHashTable(HashTable *H) 
τ 
alae abe 
m = HASHSIZE; 
H->count = m; 
H->elem = (int *)malloc(m * sizeof(int)); 
ποπ πα σος <a are) 
H->elem[i] = NULLKEY; 


return OK; 


为 了 插入 时 计算 地 址 ， 我 们 需要 定义 散 列 函数 ， 散 列 函 数 可 以 根据 不 
同情 况 更 改 算法 。 


/* 散 列 函数 */ 


int Hash(int key) 


i 
/* 除 留 余数 法 */ 
return key % m; 
} 


初始 化 完成 后 ， 我 们 可 以 对 散 列 表 进 行 播 入 操作 。 假 设 我 们 揪 入 的 关 
键 字 集 合 就 是 前 面 的 {12,67,56,16,25,37,22,29,15,47,48,34}。 


/* 插入 关键 字 进 散 列 表 */ 


void InsertHash(HashTable *H, int key) 
τ 
/* 求 散 列 地 址 */ 


int addr = Hash(key); 


/* 如 果 不 为 空 ， 则 冲突 */ 


while (H->elem[addr] != NULLKEY) 


/* 开放 定 址 法 的 线性 探测 */ 


addr = (addr + 1) % m; 


(ee 
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空位 后 插入 关键 字 */ 


H->elem[addr] = key; 


代码 中 插入 关键 字 时 ， 首 先 算 出 散 列 地 址 ， 如 琳 当 前 地 址 不 为 空 关键 
字 ， 则 说 明 有 冲突 。 此 时 我 们 应 用 开放 定 址 法 的 线性 探测 进行 重新 寻 
址 ， 此 处 也 可 更 改 为 链 地 址 法 等 其 他 解决 冲突 的 办 法 。 


散 列 表 存 在 后 ， 我 们 在 需要 时 就 可 以 通过 散 列 表 碍 找 要 的 记录 。 


/* 散 列 表 查 找 关键 字 */ 
Status SearchHash(HashTable H, int key, int *addr) 
ή 

/* 求 散 列 地 址 */ 


*addr = Hash(key); 


/* 如 果 不 为 空 ， 则 冲突 */ 
while (H.elem[*addr] != key) 


£ 


/* 开放 定 址 法 的 线性 探测 */ 


*addr = (*addr + 1) % m; 
if (H.elem[*addr] == NULLKEY || *addr == Hash(key)) 
{ 


/* 如 果 循 环 回 到 原点 */ 


/* 则 说 明 关 键 字 不 存在 */ 


return UNSUCCESS; 


} 


return SUCCESS; 


} 


ΤΥ 


8.12.2” 散 列表 查找 性 能 分 析 


最 后 ， 我 们 对 散 列 表 碍 找 的 性 能 作 一 个 简单 分 机 。 如 朱 没 有 冲突 ， 散 
列 碍 找 是 我 们 本 章 介绍 的 所 有 查找 中 效率 最 高 的 ， 因 为 它 的 时 间 复 杂 
度 为 0(1)。 可 异 ， 我 说 的 只 是 “如 果 ”， 没 有 冲突 的 散 列 只 是 一 种 理想 ， 
在 实际 的 应 用 中 ， 冲 突 是 不 可 避免 的 。 那 么 散 列 查找 的 平均 查找 长 度 
取决 于 哪些 因素 呢 ? 


1. 散 列 函数 是 否 均匀 


散 列 函数 的 好 坏 直接 影响 着 出 现 冲 突 的 频繁 程度 ， 不 过 ， 由 于 不 同 的 
散 列 函数 对 同一 组 随机 的 夭 键 字 ， 产 生 神 突 的 可 能 性 是 相 同 的 ， 因 此 
我 们 可 以 不 考虑 它 对 平均 查找 长 度 的 影响 。 


2, 处 理 冲 突 的 方法 


相同 的 关键 字 、 相 同 的 获 列 函数 ， 但 处 理 冲 突 的 方法 不 同 ， 会 使 得 平 
均 查 找 长 度 不 同 。 比 如 线性 探测 处 理 冲 突 可 能 会 产生 堆积 ， 显 然 就 没 
有 二 次 探测 法 好 ， 而 链 地 址 法 处 理 冲 突 不 会 产生 任何 堆积 ， 因 而 具有 
更 佳 的 平均 得 找 性 能 。 


3， 散 列表 的 装填 因子 


所 谓 的 装填 因子 a= 填 入 表 中 的 记录 个 数 / 散 列 表 长 度 。a 标 志 着 散 列 表 
的 装 满 的 程度 。 当 填 入 表 中 的 记录 越 多 ，a 就 越 大 ， 产 生 冲 突 的 可 能 性 
就 越 大 。 比 如 我 们 前 面 的 例子 ， 如 图 8-11-5 所 示 ， 如 果 你 的 散 列 表 长 度 
是 12， 而 填 入 表 中 的 记录 个 数 为 11， 那 么 此 时 的 装填 因子 
a=11/12=0.9167， 再 填 入 最 后 一 个 关键 字 产 生 冲 突 的 可 能 性 就 非常 之 
大 。 也 就 是 说 ， 散 列表 的 平均 查找 长 度 取决 于 装填 因子 ， 而 不 是 取决 
于 查找 集合 中 的 记录 个 数 。 


不 管 记 录 个 数 n 有 多 大 ， 我 们 总 可 以 选择 一 个 合适 的 痛 填 因子 以 便 将 平 
均 查 找 长 度 限 定 在 一 个 范围 之 内 ， 此 时 我 们 散 列 碍 找 的 时 间 复 杂 度 就 


真 的 是 0(G) 了 “。 为 了 做 到 这 一 点 ， 通 音 我 们 都 是 将 艇 列表 的 空间 设置 
得 比 查 找 集合 大 ， 此 时 虽然 是 浪费 了 一 定 的 空间 ， 但 换 来 的 是 查找 效 
率 的 大 大 提升 ， 总 的 来 说 ， 还 是 非常 值得 的 。 


8.13 ”总 结 回顾 
我 们 这 一 章 全 都 是 围绕 一 个 主题 “查找 ?来 作文 章 的 。 


首先 我 们 要 弄 清 芭 碍 找 表 、 记 录 、 头 键 字 、 主 大 键 字 、 静 态 查 找 表 、 
动态 碍 找 表 等 这 些 概 念 。 


然后 ， 对 于 顺序 表 查 找 来 说 ， 尽 管 很 士 〈 简 单 ) ， 但 它 却 是 后 面 很 多 
查找 的 基础 ， 注 意 设置 “哨兵 ”的 技巧 ， 可 以 使 得 本 已 经 很 难 提升 的 简 
单 算法 里 还 下 提高 了 性 能 。 


有 序 查 找 ， 我 们 着 重 讲 了 折 半 查找 的 思想 ， 它 在 性 能 上 比 原来 的 顺序 
查找 有 了 质 的 飞跃 ， 由 Oo) 变 成 了 OUdogn。 之 后 我 们 又 讲解 了 另外 两 
种 优秀 的 有 序 查找 : 插值 查找 和 斐 波 那 契 查找 ， 三 者 各 有 优 缺 点 ， 互 
大 家 要 仔细 体会 。 


线性 索引 查找 ， 我 们 讲解 了 稠密 索引 、 分 块 索引 和 个 排 索引 。 索 引 技 
术 被 广泛 的 用 于 文件 检索 、 数 据 库 和 搜索 引擎 等 技术 领域 ， 是 进一步 
学 习 这 些 技术 的 基础 。 


二 又 排序 树 是 动态 查找 最 重要 的 数据 结构 ， 它 可 以 在 兼顾 查找 性 能 的 
基础 上 ， 让 插入 和 删除 也 变 得 效率 较 高 。 不 过 为 了 达到 最 优 的 状态 ， 
二 又 排序 树 最 好 是 构造 成 平衡 的 二 又 树 才 最 佳 。 因 此 我 们 就 需要 再 学 
习 关 于 平衡 二 又 树 (AVL 树 ) 的 数据 结构 ， 了 人 解 AVL 树 是 如 何 处 理 平衡 
性 的 问题 。 这 部 分 是 本 章 重点 ， 需 要 认真 学 习 掌握 。 


B 树 这 种 数据 结构 是 针对 内 存 与 外 存 之 间 的 存 取 而 专门 设计 的 。 由 于 内 
外 存 的 碍 找 性 能 更 多 取决 于 读 取 的 次 数 ， 因 此 在 设计 中 要 考虑 B 树 的 平 
衡 和 层次 。 我 们 讲解 时 是 移 通过 最 最 简单 的 B 树 (2-3 树 ) 来 理解 如 何 

构建 、 插 入 、 删 除 元 素 的 操作 ， 再 通过 2-3-4 树 的 深化 ， 最 终 来 理解 B 树 
的 原理 。 之 后 ， 我 们 还 介绍 了 B+ 树 的 设计 思想 。 


散 列表 是 一 种 非常 高 效 的 查找 数据 结构 ， 在 原理 上 也 与 前 面 的 查找 不 
RBI, CET REF ZAERO, Mea elie 


RAR ο SPR, ROTOR SR ZBI EAA Aig 5 ΜΙΑ 
说 ， 散 列表 对 于 那 种 查找 性 能 要 求 融 ， 记 杂 之 间 关 系 无 要 求 的 数据 有 
APS 好 的 适用 性 。 在 学 习 中 要 注意 的 是 散 列 函数 的 选择 和 处 理 冲 突 的 
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我 们 的 “Search” 拉 术 探索 之 旅 结束 了 ， 但 也 许 ， 你 们 对 它 的 探索 才刚 刚 
开始 。 我 们 在 开 访 时 谈 到 了 搜索 引擎 改 变 了 我 们 的 生活 ， 让 我 们 获得 
信息 的 速度 提升 了 无 数 倍 。 可 是 当前 像 Google 这 样 的 搜索 引擎 ， 是 否 
就 完美 无 缺 了 呢 ? 未 来 的 搜索 应 该 又 是 什么 样 的 ? 在 本 章 的 最 后 ， 我 
根据 了 解 到 的 信息 给 大 家 做 一 个 抛 看 引 玉 。 


目前 流行 的 搜索 引擎 ， 痢 是 一 个 搜索 和 框 可 以 搜索 一 切 信息 。 这 本 走 好 
事情 ， 可 问题 在 于 第 间 在 我 们 输入 关键 词 后 ， 搜 索 获 得 的 前 面 儿 十 条 
都 不 是 我 们 需要 的 信息 ， 这 的 确 很 令 人 诅 形 。 


比如 说 ， 我 非常 喜欢 高 尔 夫 运 动 ， 平 时 也 经 常 搜索 关于 高 尔 夫 的 比 
赛 、 活 动 的 新 闻 等 信息 。 有 一 天 ， 我 想 了 解 老虎 伍兹 最 近 有 哪些 比 
赛 ， 于 是 在 搜索 框 中 输入 了 “老虎 *”， 却 得 到 了 图 8-14-1 所 示 的 结果 。 


老虎 Google 搜索 
FSi 16.000 0008S (5H 0058) «185 


AR aR .举报 图 上 


2010 年 11 朋 2? 日, 才 启 (toer)， 独 料 动物 ， 也 是 开放 陆地 上 最 强大 的 食肉 动物 之 一 ， 是 当今 
亚洲 现存 的 处 于 含 物 链 顶 注 的 食肉 动物 之 一 ， 才 记 拥 有 强 笠 动物 中 最 长 的 大 上 .. 
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大 的 一 种 ， 是 亚 州 的 特有 种 类 ， 原 产地 主要 是 东北 亚 和 东南 亚 * BERS EHH... 
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图 8-14-1 


显然 这 并 不 是 我 所 希望 得 到 的 答案 。 你 们 可 能 会 说 ， 那 是 因为 你 的 搜 
索 关 键 词 不 够 好 造成 的 ， 应 该 输入 “老虎 伍兹 ”更 恰当 。 可 问题 的 关键 
ET, PARRA TERAK”, RRI ZERE, RER 
τ 而 非 他 和 老 姿 离婚 等 八卦 新 闻 呢 ? 如 图 8- 
14-2 所 示 。 
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Pit MSE, 抽打 [EANTA] 

ERA AR LE (Erick Tiger’ Woods，1975 年 12 月 30 日 - ) ， 美 国 高 尔 夫 球 手 ， 当 前 世 
加 排名 首位 ， 并 被 公认 为 史上 最 成 功 的 高 尔 夫 球 手 之 一 。。 

zh wikipedia org/zh/eth [1 - Pia hee 
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尔 夫 球 手 之 一 。 因 为 在 英文 中 他 的 缚 号 Tiger 的 意思 是 ' 虎 '， 所 以 在 中 文中 经 常 ， 

PADE- 夺冠 经 历 -新 闻 报 道 ~ (HAE I 

baike.baidu.comjview/124613.htm - MARE -AMAR 


ΠΗΧΗΕΕΉΕΕ MERA 

2009 年 11 月 2 日 ,, A Βλ ΕΠΣΕ ΛΣ ΤΝ Ba CHAM EA A. AL 
RRYACAGA EERIE EE REARS ΒΒ, PERHEEN 

sports. 163,com/special/000540EA/woods09. html - 网页 快 昭 -类似 结果 


图 8-14-2 


如 琳 未 来 的 搜索 引擎 在 我 授权 的 情况 下 ， 记 隶 我 平时 的 搜索 喜好 ， 调 
整 搜索 内 容 的 优先 度 ， 并 把 我 可 能 想 了 解 的 信息 放 在 前 列 ， 这 样 也 许 
就 不 至 于 产生 找 伍兹 给 只 大 老虎 的 困惑 了 。 


呵呵 1! 如 果 我 是 个 喜欢 汽车 的 人 ， 时 常 搜 汽车 信息 。 那 么 当 我 在 搜索 
框 中 输入 “甲壳 虫 ”\“ 美 洲 虎 "\“ 林 肯 ”`\“ 福 特 ” 等 关键 词 时 ， 不 要 让 动 
物 和 人 物 成 为 搜索 的 头条 。 哪 怕 是 输入 “QQ” 时 ， 搜 索引 擎 也 应 该 将 奇 
瑞 汽 车 而 不 是 腾讯 IM 列 在 首位 。 进 一 步 ， 如 果 我 喜欢 汽车 图 片 ， 搜 索 
引擎 瓯 首先 提供 相关 的 汽车 图 片 ， 我 更 关注 新 闻 ， 它 残 提 供 最 新 的 汽 
车 新 闻 ， 我 关注 价格 ， 那 瓯 提 供 相 关 型 号 车 子 的 市 场 报价 。 当 然 ， 其 
他 相关 信息 并 不 是 不 提供 了 ， 只 不 过 在 排序 上 应 该 相对 靠 后 而 已 。 这 
ΙΝ, 
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好 了 ， 这 个 话题 一 展开 束 没 完 没 了 了 “。 也 许 不 久 的 将 来 , “你 一 动 念 
头 ， 搜 索 结 末了 殉 会 冒 出 来 ”成 为 真 的 现实 ， 那 真是 太 棒 了 “。 在 座 各 位 ， 
好 好 努力 吧 。 下 课 ! 


第 9 章 排序 


局 示 

排序 : 

假设 富有 i 个 记录 的 序列 为 {I 12... r,}， 其 相应 的 关键 字 分 别 为 {k 
a Κα}, wear 1,2,.....,.nHI—PPHEVIp | poy... p，， 使 其 相应 的 
关键 字 满 足 k p <k wz <.…..<k m ( 非 递减 或 非 递增 ) 关系 ， 即 使 得 序列 
BOA MEA BEF FFF AIFF TE pT prp ro 了， 这 样 的 操作 束 称 为 排 
序 

91 35Η 


大 家 好 ! 你 们 有 没有 在 网 上 买 过 东西 啊 ? 


AE 居然 还 有 人 说 没有 有。 呵呵 ， 在 座 的 都 是 大 学 生 ， 应 该 很 多 同学 都 
有 过 网 购 的 经 历 。 哪 怕 真 的 没有 ， 也 看 到 或 听 a 到 过 一 些 ， 现 在 网 上 购 
物 已 经 相对 成 熟 ， 对 用 户 来 说 市 来 了 很 大 的 方便 。 


假如 我 想 买 一 台 iPhone4 的 手机 ， 于 是 上 了 茶 电 子 丙 务 网 站 去 搜索 。 可 
搜索 后 发 现 (如 图 9-1-1 所 示 ) ， 有 8863 个 相关 的 物品 ， 如 此 之 多 ， 这 
叫 我 如 何 选择 。 我 其 实 征 想 买 便宜 一 总 的 ， 但 是 又 介 遇 到 统 子 ， 想 找 
信誉 好 的 商家 ， 如 何 做 ? 
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图 9-1-1 


下 面 的 有 些 购物 达 人 给 我 出 主意 了 ， 排 序 蚜 。 对 呀 ， 排 序 就 行 了 (如 
图 9-1-2 所 示 ) 。 我 完全 可 以 根据 自己 的 需要 对 搜索 到 的 商品 进行 排 
序 ， 比 如 按 信用 从 高 到 低 、 再 按 价格 从 低 到 高 ， 将 最 符合 我 预期 的 商 
品 列 在 前 面 ， 最 终 找 到 我 愿意 购买 的 商家 ， 非 常 的 方便 。 
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图 9-1-2 


网 站 是 如 何 做 到 快速 地 将 商品 按 某 种 规则 有 序 的 呢 ? 这 束 古 我 们 今天 
要 讲解 的 重要 课题 一 排序 。 


9.2 ”排序 的 基本 概念 与 分 类 


排序 是 我 们 生活 中 经 常会 面 对 的 问题 。 同 学 们 做 操 时 会 按照 从 矮 到 高 
排列 ;老师 查看 上 课 出 勤 情况 时 ， 会 按 学 生 学 号 顺序 点 名 ; 高 考 孙 取 
时 ， 会 按 成 绩 总 分 降序 依次 录取 等 。 那 排序 的 严格 定义 古 什 么 呢 ? 


假设 含有 n 个 记录 的 序列 为 {r iira ,rn}， 其 相应 的 关键 字 分 别 为 {k , 
ο 5}， 需 确定 1,2,…n 的 一 种 排列 p 1,p ，,….…,pa。， 使 其 相应 的 
关键 字 满足 kw SK po <.…..<k py ( 非 递 减 或 非 递增 ) 关系 ， 即 使 得 序列 
成 为 一 个 按 关键 字 有 序 的 序列 fr ur ,rm}， 这 样 的 操作 就 称 为 拓 
序 。 


注意 我 们 在 排序 问题 中 ， 通 党 将 数据 元 素 称 为 记录 。 显 然 我 们 输入 的 
是 一 个 记录 集合 ， 输 出 的 也 是 一 个 记录 集合 ， 所 以 说 ， 可 以 将 排序 看 
成 是 线性 表 的 一 种 操作 ο 


排序 的 依据 是 关键 字 之 间 的 大 小 关系 ， 那 么 ， 对 同一 个 记录 集合 ， 针 
对 不 同 的 关键 字 进 行 排序 ， 可 以 得 到 不 同 序列 。 


这 里 关键 字 k; 可 以 是 记录 r 的 主 天 键 字 ， 也 可 以 是 次 关键 字 ， 甚 至 是 车 
于 数据 项 的 组 合 。 比 如 我 们 某 些 大 学 为 了 选拔 在 主 科 上 更 优秀 的 学 
生 ， 要 求 对 所 有 学 生 的 所 有 科目 总 分 降序 排名 ， 并 且 在 同样 总 分 的 情 
况 下 将 语 数 外 总 分 做 降序 排名 。 这 就 是 对 总 分 和 语 数 外 总 分 两 个 次 关 
键 字 的 组 合 排序 。 如 图 9-2-1 所 示 ， 对 于 组 合 排序 的 问题 ， 当 然 可 以 先 
排 厅 总 分 ， 戎 总 分 相等 的 情况 下 ， 再 排序 语 数 外 总 分 ;但 这 是 比较 十 
的 办 法 。 我 们 还 可 以 应 用 一 个 技巧 来 实现 一 次 排序 即 完成 组 合 排序 问 
题 ， 例 如 ， 把 总 分 与 语 数 外 都 当成 字符 串 首 尾 连 接 在 一 起 (注意 语 数 
外 总 分 如 果 位 数 不 够 三 位 ， 需 要 在 前 面 补 零 ) ， 很 容易 可 以 得 到 令 狐 
ΛΓ FETKIC REE FOOTY 
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图 9-2-1 


从 这 个 例子 也 可 看 出 ， 多 个 关键 字 的 排序 最 终 都 可 以 转化 为 单个 关键 
字 的 排序 ， 因 此 ， 我 们 这 里 主要 讨论 的 是 单个 关键 字 的 排序 。 


9.2.1 排序 的 稳定 性 


也 正 是 由 于 排序 不 仅 是 针对 主 关 键 字 ， 那 么 对 于 次 关键 字 ， 因 为 待 排 
序 的 记录 序列 中 可 能 存在 两 个 或 两 个 以 上 的 关键 字 相 等 的 记录 ， 排 序 
结 采 可 能 会 存在 不 唯一 的 情况 ， 我 们 给 出 了 稳定 与 不 稳定 排序 的 定 
Νο 


假设 ki =k; (1sisn,1sjsni4j) ， 且 在 排序 前 的 序列 中 ri Scr, (BP 
i<j) 。 如 采 排 序 后 ri 仍 领 先 于 rj ， 则 称 所 用 的 排序 方法 是 稳定 的 ; 反 
之 ， 帮 可 能 使 得 排序 后 的 序列 中 rj 领先 r; ， 则 称 所 用 的 排序 方法 是 不 稳 
定 的 。 如 图 9-2-2 所 示 ， 经 过 对 总 分 的 降序 排序 后 ， 总 分 高 的 排 在 前 

列 。 此 时 对 于 令狐冲 和 张无忌 而 言 ， 未 排序 时 是 令狐冲 在 前 ， 那 么 它 
们 总 分 排序 后 ， 分 数 相 等 的 令狐冲 依然 应 该 在 前 ， 这 样 才 算是 稳定 的 
排序 ， 如 果 他 们 二 者 颠倒 了 ， 则 此 排序 是 不 稳定 的 了 。 只 要 有 一 组 关 
键 字 实 例 发 生 类 似 情 况 ， 就 可 认为 此 排序 方法 是 不 稳定 的 。 排 序 算法 
征 否 稳定 的 ， 要 通过 分 析 后 才能 得 出 。 
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图 9-2-2 
9.2.2 ”内 排序 与 外 排序 


根据 在 排序 过 程 中 竺 排序 的 记录 有 是否 全 部 被 放置 在 内 存 中 ， 排 序 分 
为 : 内 排序 和 外 排序 。 


内 排序 是 在 排序 整个 过 程 中 ， 待 排序 的 所 有 记录 全 部 被 放置 在 内 存 
中 。 外 排序 是 由 于 排序 的 记录 个 数 太 多 ， 不 能 同时 放置 在 内 存 ， 整 个 
排序 过 程 需 要 在 内 外 存 之 间 多 次 交换 数据 才能 进行 。 我 们 这 里 主要 整 
介绍 内 排序 的 多 种 方法 。 


对 于 内 排序 来 说 ， 排 序 算法 的 性 能 主要 是 受 3 个 方面 影响 : 
1. 时 间 性 能 


排序 是 数据 处 理 中 经 常 执行 的 一 种 操作 ， 往 往 属于 系统 的 核心 部 分 ， 

因此 排序 算法 的 时 间 开 销 是 衡量 其 好 坏 的 最 重要 的 标志 。 在 内 排序 

中 ， 主 要 进行 两 种 操作 : 比较 和 移动 。 比 较 指 关键 字 之 间 的 比较 ， 这 
是 要 做 排序 最 起 码 的 操作 。 移 动 指 记录 从 一 个 位 置 移动 到 另 一 个 位 

置 ， 事实 上 ， 移 动 可 以 通过 改变 记录 的 存储 方式 来 予以 避免 (这 个 我 
们 在 讲解 具体 的 算法 时 再 谈 ) 。 总 之 ， 高 效率 的 内 排序 算法 应 该 是 具 
有 尽 可 能 少 的 关键 字 比 较 次 数 和 尽 可 能 少 的 记录 移动 次 数 。 


2. 辅助 空间 


评价 排序 算法 的 丸 一 个 主要 标准 是 执行 算法 所 需要 的 辅助 存储 空间 。 
辅助 存储 空间 是 除了 存放 行 排序 所 占用 的 存储 空间 之 外 ， 执 行 算法 所 
需要 的 其 他 存储 空间 。 


3. 算法 的 复杂 性 

注意 这 里 指 的 是 算法 本 身 的 复杂 度 ， 而 不 是 指 算法 的 时 间 复 杂 度 。 显 
然 算 法 过 于 复杂 也 会 影响 排序 的 性 能 。 

根据 排序 过 程 中 借助 的 主要 操作 ， 我 们 把 内 排序 分 为 : 插入 排序 、 交 
换 排序 、 选 择 排序 和 归并 排序 。 可 以 说 ， 这 些 都 是 比较 成 熟 的 排序 技 


术 ， 已 经 被 广泛 地 应 用 于 许 许多 多 的 程序 语言 或 数据 库 当 中 ， 甚 至 它 
们 都 已 经 封装 了 关于 排序 算法 的 实现 代码 。 因 此 ， 我 们 学 习 这 些 排序 


算法 的 目的 更 多 并 不 是 为 了 去 在 现实 中 编程 排序 算法 ， 而 是 通过 学 习 
来 提高 我 们 编写 算法 的 能 力 ， 以 便于 去 解决 更 多 复杂 和 灵活 的 应 用 性 


问题 。 

本 章 一 共 要 讲解 七 种 排序 的 算法 ， 按 照 算法 的 复杂 度 分 为 两 大 类 ， 时 
泡 排序 、 简 单 选 择 排 序 和 直接 插入 排序 属于 简单 算法 ， 而 希 尔 排序 、 
堆 排 序 、 归 并 排序 、 快 速 排序 属于 改进 算法 。 后 面 我 们 将 依次 讲解 。 
9.2.3 “排序 用 到 的 结构 与 函数 


为 了 讲 清 楚 排 序 算 法 的 代码 ， 我 完 提供 一 个 用 于 排序 用 的 顺序 表 结 
构 ， 此 结构 也 将 用 于 之 后 我 们 要 讲 的 所 有 排序 算法 。 


/* 用 于 要 排序 数组 个 数 最 大 值 ， 可 根据 需要 修改 */ 


#define MAXSIZE 10 


typedef struct 


€ 
/* 用 于 存储 要 排序 数组 ，r[6] 用 作 哨 兵 或 临时 变量 */ 
int r[MAXSIZE + 1]; 
/* 用 于 记录 顺序 表 的 长 度 */ 
int length; 
ους 
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/* 交换 L 中 数组 r 的 下 标 为 i 和 j 的 值 */ 


void swap(SqList *L, int i, int j) 
ie 

int temp = L->r[i]; 

L->r[i] = L->r[j]; 


L->r[j] = temp; 


} 
好 了 ， 说 了 这 么 多 ， 我 们 来 看 第 一 个 排序 算法 。 
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无 论 你 学 习 哪 种 编程 语言 ， 在 学 到 循环 和 数组 时 ， 通 常 都 会 介绍 一 种 
排序 算法 来 作为 例子 ， 而 这 个 算法 一 般 就 是 冒 泡 排 序 。 并 不 是 它 的 名 
称 很 好 听 ， 而 是 说 这 个 算法 的 思路 最 简单 ， 最 容易 理解 。 因 此 ， 哪 怕 
人 
F ZIR 5 


图 9-3-1 
9.3.1 最 简单 排序 实现 


冒 泡 排序 (Bubble Sort) 一 种 交换 排序 ， 它 的 基本 思想 是 : 两 两 比较 相 

邻 记录 的 关键 字 ， 如 果 反 序 则 交换 ， 直 到 没有 反 序 的 记录 为 止 。 冒 泡 
的 实现 在 细 广 上 可 以 有 很 多 种 变化 ， 我 们 将 分 别 就 3 种 不 同 的 冒 泡 实现 
ο τος 138, {ΠΙΟΣ A GA δ E 
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/* 对 顺序 表 L 作 交换 排序 ( 冒 泡 排 序 初级 版 ) */ 


void BubbleSort0o(SqList *L) 


{ 
Ες 
for (i = 1; i < L->length; it+) 
{ 
for (j = i + 1; 1 <= L->length; j++) 
{ 
πο πμ ς Επ 
{ 
/* 交换 L->r[i] 与 L->r[j] 的 值 */ 
EOE ος 
二 
下 
} 


这 段 代 码 严 格 意 义 上 说 ， 不 算是 标准 的 冒 泡 排序 算法 ， 因 为 它 不 满 
足 “ 两 两 比较 相 邻 记录 ”的 冒 泡 排序 思想 ， 它 更 应 该 吓 最 最 简单 的 交换 
排序 而 已 。 它 的 思路 束 是 让 每 一 个 关键 字 ， 都 和 它 后 面 的 每 一 个 关键 
字 比 较 ， 如 采 大 则 交换 ， 这 样 第 一 位 置 的 夭 键 字 在 一 次 循环 后 一 定 变 
成 最 小 值 。 如 图 9-3-2 所 示 ， 假 设 我 们 符 排 序 的 关键 字 序 列 是 
{9,1,5,8,3,7,4,6,2} ， 当 二 1 时 ，9 与 1 交换 后 ， 在 第 一 位 置 的 1 与 后 面 的 天 


键 字 比较 都 小 ， 因 此 它 殉 是 最 小 值 。 当 i=2 时 ， 第 二 位 置 匈 后 由 9 换 成 
换 成 2， 完 成 了 第 二 小 的 数字 交换 。 后 面 的 数字 变换 类 似 ， 
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图 9-3-2 

它 应 该 算是 最 最 容易 写 出 的 排序 代码 了 ， 不 过 这 个 简单 易 懂 的 代码 ， 
却 是 有 缺陷 的 。 观 察 后 发 现 ， 在 排序 好 1 和 2 的 位 置 后 ， 对 其 余 关 键 字 
的 排序 没有 什么 帮助 (数字 3 反而 还 被 换 到 了 最 后 一 位 ) 。 也 就 是 说 ， 
这 个 算法 的 效率 是 非常 低 的 。 

9.3.2” 冒 泡 排 序 算法 

我 们 来 看 看 正宗 的 冒 泡 算法 ， 有 没有 什么 改进 的 地 方 。 


/* 对 顺序 表 L 作 冒 泡 排 序 */ 


void BubbleSort(SqList *L) 
i 
μα al, le 
Ίος (αἱ ale ας ESNE πες) 
it 
/* 注意 j 是 从 后 往 前 循环 */ 


for (j = L->length - 1; j >= i;j--) 


{ 


/* 若 前 者 大 于 后 者 (注意 这 里 与 上 一 算法 差异 ) */ 


ly (lL | .| Ss je 


{ 
/* 交换 L->r[j] 与 L->r[j+1] 的 值 */ 


swap(L, j, j + 1); 


} 


依然 假设 我 们 待 排 序 的 关键 字 序 列 是 {9,1,5,8,3,7,4,6,2} ， 当 i=1 时 ， 变 量 
j 由 8 反问 循环 到 1， 了 逐个 比较 ， 将 较 小 值 交 换 到 前 面 ， 直 到 最 后 找到 最 
小 值 放置 在 了 第 1 的 位 置 。 如 图 9-3-3 所 示 ， 当 i=1、j=8 时 ， 我 们 发 现 


6>2， 因 此 交换 了 它们 的 位 置 ，j=7 时 ，4>2， 所 以 交换 ...... 直 到 j=2 时 ， 
因为 1<2， 所 以 不 交换 。j=1 时 ，9>1， 交 换 ， 最 终 得 到 最 小 值 1 放置 第 
一 的 位 置 。 事 实 上 ， 在 不 断 循环 的 过 程 中 ， 除 了 将 关键 字 1 放 到 第 一 的 
位 置 ， 我 们 还 将 关键 字 2 从 第 九 位 置 提 到 了 第 三 的 位 置 ， 显 然 这 一 算法 
比 前 面 的 要 有 进步 ， 在 上 十 万 条 数据 的 排序 过 程 中 ， 这 种 差异 会 体现 
ο ο ᾽ ἔν, 因此 就 将 此 算法 命 
名 为 冒 泡 算法 。 


Mi 


图 9-3-3 


当 这 2 时 ， 变 量 j 由 8 反 向 循环 到 2， 逐 个 比较 ， 在 将 关键 字 2 交 换 到 第 二 
位 置 的 同时 ， 也 将 关键 字 4 和 3 有 所 提升 。 


当 i=2 时 将 次 小 但 2 由 泡 到 第 二 位 置 


图 9-3-4 
后 面 的 数字 变换 很 简单 ， 这 里 就 不 在 详 述 了 ο 
9.3.3” 冒 泡 排序 优化 


这 样 的 冒 泡 程序 是 否 还 可 以 优化 呢 ? 答案 是 肯定 的 。 试 想 一 下 ， 如 果 

我 们 待 排序 的 序列 是 {2,1,3,4,5,6,7,8,9}， 也 就 是 说 ， 除 了 第 一 和 第 二 的 
关键 字 需 要 交换 外 ， 别 的 都 已 经 是 正常 的 顺序 。 当 i=1 时 ， 交 换 了 2 和 

1， 此 时 序列 已 经 有 序 ， 但 是 算法 仍然 不 依 不 饶 地 将 i=2 到 9 以 及 每 个 循 
环 中 的 j 循 环 都 执行 了 一 遍 ， 尽 管 并 没有 交换 数据 ， 但 是 之 后 的 大 量 比 
较 还 是 大 大 地 多 余 了 ， 如 图 9-3-5 所 示 。 


当 i=2 时 ， 由 于 没有 任何 数据 ”之 后 的 循环 判断 都 是 多 余 
交换， 就 说 明 此 序列 已 经 有 序 


图 9-3-5 
当 这 2 时 ， 我 们 已 经 对 9 与 8，8 与 7，.……，3 与 2 作 了 比较 ， 没 有 任何 数 
据 交 换 ， 这 就 说 明 此 序列 已 经 有 序 ， 不 需要 再 继续 后 面 的 循环 判断 工 
作 了 。 为 了 实现 这 个 想法 ， 我 们 需要 改进 一 下 代码 ， 增 加 一 个 标记 变 
量 flag 来 实现 这 一 算法 的 改进 © 


/* 对 顺序 表 L 作 改进 冒 泡 算法 */ 


void BubbleSort2(SqList *L) 


ή 


ale ατα. Πρ 


/* flag 用 来 作为 标记 */ 


Status flag = TRUE; 


/* 若 flag 为 true 说 明 有 过 数据 交换 ， 否 则 停止 循环 */ 


for (i = 1; i < L->length && flag; i++) 


{ 
/* 初始 为 false */ 
flag = FALSE; 
for (j = L->length - 1; 1 >= 1; j--) 
€ 
mEn Eea 
{ 
/* 交换 L->r[j] 与 L->r[j+1] 的 值 */ 
swap aL πῃ πως 
/* 如 果 有 数据 交换 ， 则 flag 为 true */ 
flag = TRUE; 
} 
J 
} 


代码 改动 的 关键 束 是 在 ij 变量 的 for 循 环 中 ， 增 加 了 对 flag 是 否 为 true 的 判 
断 。 经 过 这 样 的 改进 ， 冒 宛 排 序 在 性 能 上 就 有 了 一 些 提升 ， 可 以 避免 
因 已 经 有 序 的 情况 下 的 无 意义 循环 判断 。 


95.4 冒 泡 排序 复杂 度 分 析 
分 析 一 下 它 的 时 间 复 杂 度 。 当 最 好 的 情况 ， 也 就 是 要 排序 的 表 本 身 就 


征 有 序 的 ， 那 么 我 们 比较 次 数 ， 根 据 最 后 改进 的 代码 ， 可 以 推 呆 出 就 
是 n-1 次 的 比较 ， 没 有 数据 交换 ， 时 间 复 杂 度 为 O(n)。 当 最 坏 的 情况 ， 


即 待 排 序 表 是 逆序 的 情况 ， 此 时 需要 比较 sigma(i=2, n, i-1)=1+2+3+...+ 
(n-1)=n(n-1)/2 次 ， 并 作 等 数量 级 的 记录 移动 。 因 此 ， 总 的 时 间 复 杂 度 为 
O(n?) ° 
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爱 炒股 票 短线 的 人 ， 总 是 喜欢 不 断 的 买 进 卖 出 ， 想 通过 价差 来 实现 盈 
利 。 但 通常 这 种 频 莹 操作 的 人 ， 即 使 失 译 不 多 ， 也 会 因为 操作 的 手续 
费 和 印花 税 过 高 而 获 利 很 少 。 还 有 一 种 做 股票 的 人 ， 他 们 很 少 出 手 ， 
只 是 在 不 断 的 观察 和 判断 ， 等 到 时 机 一 到 ， 采 断 闫 进 或 喜 出 。 他 们 因 
为 冷静 和 沉着 ， 以 及 交易 的 次 数 少 ， 而 最 终 收益 颇 丰 。 


冒 泡 排 序 的 思想 就 是 不 断 地 在 交换 ， 通 过 交换 完成 最 终 的 排序 ， 这 和 
做 股票 短线 频 葵 操作 的 人 是 类 似 的 。 我 们 可 不 可 以 像 只 有 在 时 机 非常 
明确 到 来 时 才 出 手 的 股票 高 手 一 样 ， 也 就 是 在 排序 时 找到 合适 的 关键 
字 再 做 交换 ， 并 且 只 移动 一 次 就 完成 相应 关键 字 的 排序 定位 工作 呢 ? 
这 束 是 选择 排序 法 的 初步 思想 。 

选择 排序 的 基本 思想 是 每 一 趟 在 n-i 十 1(i=1,2,.…,n-1) 个 记录 中 选取 关键 
字 最 小 的 记录 作为 有 序 序列 的 第 个 记录 。 我 们 这 里 先 介 绍 的 是 简单 选 
择 排 序 法 。 

9.4.1 简单 选择 排序 算法 

简单 选择 排序 法 (Simple Selection Sort) 就 是 通过 n-i 次 关键 字 间 的 比 
ο 1 个 记录 中 选 出 关键 字 最 小 的 记录 ， 并 和 第 i (1ςΙκπ) “id 
5 AN o 


我 们 来 看 代码 。 


/* 对 顺序 表 L 作 简单 选择 排序 */ 


void SelectSort(SqList *L) 
τ 
"πο, abe ΠΠΠΕ 
OIG (Gi σης ahora EENE ὑπ 


x 


/* 将 当前 下 标定 义 为 最 小 值 下 标 */ 


min = i; 


/* 循环 之 后 的 数据 */ 
for (j = i+ 1; j <= L->length; j++) 
{ 


/* 如 果 有 小 于 当前 最 小 值 的 关键 字 */ 


Ti 
/* 将 此 关键 字 的 下 标 赋值 给 min */ 
mines 

} 

/* 若 min 不 等 于 说 明 找 到 最 小 值 ， 交 换 */ 


if (i != min) 
/* 交换 L->r[i] 与 L->r[min] 的 值 */ 


swap(L, i, min); 


代码 应 该 说 不 难 理解 ， 针 对 竺 排序 的 关键 字 序 ο arom ie 
对 i 从 1 循环 到 8。 当 i=1 时 ，L.r[ij=9，min 开 始 是 1， 然 后 与 j=2 到 9 比较 
Lr[min] 与 L.r[] 的 大 小 ， 因 为 j=2 时 最 小 ， AF Dimin= 2。 最 终 交 换 了 L.r[2] 
如 图 9-4-1 所 示 ， 注 意 ， 这 里 比较 了 8 次 ， 却 只 交换 数据 
BRLE—IK © 
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图 9-4-1 


当 i=2 时 ，L.r[i=9，min 开 始 是 2， 经 过 比较 后 ，min=9， 交 换 L.r[min] 与 
Li 的 值 。 如 图 9-4-2 所 示 ， 这 样 吏 找 到 了 第 二 位 置 的 关键 字 ο 


U oh | 


(52 min=9 


图 9-4-2 


当 i=3 时 ，L.rfi=5，min 开 始 是 3， 经 过 比较 后 ，min=5， 交 换 L.r[min] 与 
L.r[i] 的 值 。 如 图 9-4-3 所 示 。 
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图 9-4-3 
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9.4.2 ”简单 选择 排序 复杂 度 分 析 


从 简单 选择 排序 的 过 程 来 看 ， 它 最 大 的 特点 束 是 交换 移动 数据 次 数 相 

当 少 ， 这 样 也 就 节约 了 相应 的 时 间 。 分 析 它 的 时 间 复 杂 度 发 现 ， 无 论 
最 好 最 其 的 情况 ， 其 比较 次 数 都 是 一 样 的 多 ， 第 赴 排 序 需 要 进行 n-i 次 
关键 字 的 比较 ， 此 时 需要 比较 sigma(i=1, n-1, n-i)=(n-1)+(n-2)+...+1=n(n- 
1)/2 次 。 而 对 于 交换 次 数 而 言 ， 当 最 好 的 时 候 ， 交 换 为 0 次 ， 最 差 的 时 
候 ， 也 就 初始 降序 时 ， 交 换 次 数 为 n-1 次 ， 基 于 最 终 的 排序 时 间 是 比较 
与 交换 的 次 数 总 和 和， 因此， 总 的 时 间 复 杂 度 依然 为 O(n“)。 


应 该 说 ， 尽 管 与 冒 泡 排序 同 为 O(n*)， 但 简单 选择 排序 的 性 能 上 还 是 要 
略 优 于 冒 泡 排序 。 


95 ”直接 插入 排序 


να ce Be LE BE Aa) BED PRK ο EARS re IA Ae 

边 摸 牌 ， 一 边 理 牌 。 假 如 我 们 拿 到 了 这 样 一 手 牌 ， 如 图 9-5-1 所 示 。 
呵 ， 似 乎 是 同花顺 呀 ， 别 急 ， 我 们 得 理 一 理 顺 序 才 知 道 是 否 是 真 的 同 
伦 顺 。 请 问 ， 如 琳 是 你 ， 应 该 如 何 理 有 牌 呢 ? 


图 9-5-1 

应 该 说 ， 哪 怕 你 是 第 一 次 玩 扑 克 牌 ， 只 要 认识 这 些 数 字 ， 理 牌 的 方法 
都 是 不 用 教 的 。 将 3 和 4 移动 到 5 的 左 人 出， 再 将 2 移动 到 最 左 侧 ， 顺 序 就 
算是 理 好 了 。 这 里 ， 我 们 的 理 牌 方法 ， 就 是 直接 插入 排序 法 。 

95.1 ”直接 插入 排序 算法 


直接 插入 排序 (Straight Insertion Sort) 的 基本 操作 是 将 一 个 记录 插入 
到 已 经 排 好 序 的 有 序 表 中 ， 从 而 得 到 一 个 新 的 、 记 录 数 增 1 的 有 序 表 。 


顾名思义 ， 从 名 称 上 也 可 以 知道 它 是 一 种 插入 排序 的 方法 。 我 们 来 看 
直接 插入 排序 法 的 代码 。 


/* 对 顺序 表 L 作 直接 插入 排序 */ 


void InsertSort(SqList *L) 


{ 


alin πι ΙΡ 
for (i = 2; i <= L->length; i++) 
{ 


/* 需 将 L->r[i] 插 入 有 序 子 表 */ 


e (URS Ve [iti] eee el dl) 
{ 


7* 设置 哨兵 */ 


L->r[0] = L->r[i]; 
DOPAC Rae ο ρα οὐ Ὁ 
/* 记录 后 移 */ 


eE E 


/* 插入 到 正确 位 置 */ 


L->r[j + 1] = L->r[0]; 


Ἡ 


1. 程序 开始 运行 ， 此 时 我 们 传 入 的 SqList 参 数 的 值 为 length=6,r[6]= 
{0,5,3,4,6,2} ， 其 中 r[0]=0 将 用 于 后 面 起 到 哨兵 的 作用 。 


2. 第 4~13 行 就 是 排序 的 主 循环 。i 从 2 开始 的 意思 是 我 们 假设 r[1]=5 已 
经 放 好 位 置 ， 后 面 的 牌 其 实 克 是 插入 到 它 的 左 侧 还 是 右 侧 的 问题 。 


3. 第 6 行 ， 此 时 i=2，L.r[=3 比 Lr[i-1H=5 要 小 ， 因 此 执行 第 8~11 行 的 

操作 。 第 8 行 ， 我 们 将 L.r[0] 赋 值 为 L.r[=3 的 目的 是 为 了 起 到 第 9 一 10 行 
的 循环 终止 的 判断 依据 。 如 图 9-5-2 所 示 。 图 中 下 方 的 虚线 箭头 ， 就 是 

第 10 行 ，L.r[j+1]=L.r[j] 的 过 程 ， 将 5 右 移 一 位 。 


Jf 
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图 9-5-2 

4. 此 时 ， 第 10 行 就 是 在 移动 完成 后 ， 空 出 了 空位 ， 然 后 第 11 行 
L.r[j+1]=L.r[0]， 将 哨兵 的 3 赋值 给 j=0 时 的 L.rlj+1]， 也 就 是 说 ， 将 扑克 
牌 3 放置 到 L:r[] 的 位 置 ， 如 图 9-5-3 所 示 。 
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图 9-5-3 

5. 继续 循环 ， 第 6 行 ， 因 为 此 时 i=3，L.r[i]=4 比 L.r[i-1]=5 要 小 ， 因 此 执 
行 第 8~11 行 的 操作 ， 将 5 再 右 移 一 位 ， 将 4 放置 到 当前 5 所 在 位 置 ， 如 
图 9-5-4 所 示 。 


图 9-5-4 


6. 再 次 循环 ， 此 时 i=4。 因 为 L.r[i=6 比 L.rfi1H=5 要 大 ， 于 是 第 8~11 行 
代码 不 执行 ， 此 时 前 三 张 牌 的 位 置 没 有 变化 ， 如 图 9-5-5 所 示 。 


图 9-5-5 

7， 再 次 循环 ， 此 时 i=5， 因 为 L.r[=2 比 L.r[fi-1]=6 要 小 ， 因 此 执行 第 8~- 
11 行 的 操作 。 由 于 6、5、4、3 都 比 2 小 ， 它 们 都 将 右 移 一 位 ， 将 2 放置 
到 当前 3 所 在 位 置 。 如 图 9-5-6 所 示 。 此 时 我 们 的 排序 也 就 完成 了 。 


. 
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9-5-6 
95.2 ”直接 插入 排序 复杂 度 分 析 


我 们 来 分 析 一 下 这 个 算法 ， 从 空间 上 来 看 ， 它 只 需要 一 个 记录 的 辅助 
空间 ， 因 此 关键 是 看 它 的 时 间 复 杂 度 。 


当 最 好 的 情况 ， 也 就 是 要 排序 的 表 本 身 就 是 有 序 的 ， 比 如 纸牌 拿 到 后 
束 是 {2,3,4,.5,6}， 那 么 我 们 比较 次 数 ， 其 实 束 是 代码 第 6 行 每 个 L.r[i 与 
Lr[i-1] 的 比较 ， 共 比较 了 (n-1)sigma(i=2, n, TD) 次 ， 由 于 每 次 都 是 
L.r[i]>L.r[i-1]， 因 此 没有 移动 的 记录 ， 时 间 复 杂 度 为 O(n)。 


当 最 坏 的 情况 ， 即 待 排序 表 是 逆序 的 情况 ， 比 如 {6,5,4,3,2}， 此 时 需要 
比较 sigma(i=2, n, i)=2+3+...+n=(n+2)(n-1)/2 次 ， 而 记录 的 移动 次 数 也 达 
到 最 大 值 sigma(i=2, n, i+1)=(n+4)(n-1)/2 次 。 


如 采 排 序 记录 是 随机 的 ， 那 么 根据 概率 相同 的 原则 ， 平 均 比 较 和 移动 
次 数 约 为 n“ /4 次 。 因 此 ， 我 们 得 出 直接 插入 排序 法 的 时 间 复 杂 度 为 OO 
“)。 从 这 里 也 看 出 ， 同 样 的 O(n“) 时 间 复 杂 度 ， 直 接 插 入 排序 法 比 冒 泡 
和 简单 选择 排序 的 性 能 要 好 一 些 。 


96 “和 希 尔 排序 
给 大 家 出 一 道 智力 题 。 请 问 “VIT" 是 什么 ? 


虽 ， 很 好 ， 它 是 罗马 数字 的 7。 现 在 我 们 要 给 它 加 上 一 笔 ， 让 筷 变 成 8 
(VIII) ， ΤΗ 只 需要 在 右 侧 加 一 ΠΡΩΙ 


现在 我 请 大 家 试 着 对 罗马 数字 9， 也 就 是 “IX” 增 加 一 笔 ， 把 它 变 成 6， 
应 该 怎么 做 ? LOPE) 


Α.Σ Bit, “这 怎么 可 能 ! ”可 为 什么 一 定 要 用 常规 方法 
WE 


我 这 里 有 3 种 另类 的 方法 可 以 实现 它 。 


方法 一 : 观察 发 现 “X” 其 实 可 以 看 作 是 一 个 正 放 一 个 倒置 两 个 “V”。 
此 我 们 ， 给 “IX”* 中 间 加 一 条 水 平 线 ， 上 下 颠倒 ， 然 后 遮 住 下 面部 分 ， 
也 就 是 说 ， 我 们 所 谓 的 加 上 一 笔 束 是 让 住 一 部 分 ， 于 是 就 得 到 “V1”， 
如 图 9-6-1 所 示 。 


图 9-6-1 


方法 二 : 在 “IX” 前 面 加 一 个 “S”， 此 时 构成 一 个 英文 单词 “SIX”， 这 就 等 
于 得 到 一 个 6 了 。 哈 哈 ， 我 听 到 下 面 一 片 哗然 ， 我 刚 有 没有 说 一 定 要 
是 “VET 呀 ， 我 只 说 把 它 变 成 6 而 已 ， 至 于 是 罗马 数字 还 是 英文 单词 ， 我 
可 没有 限制 。 显 然 ， 你 们 的 思维 受到 了 我 前 面 举例 的 “VIIT 转 变 

为 “VIID 的 影响 ， 如 图 9-6-2 所 示 。 


X> SIX 


图 9-6-2 


方法 三 ， 在 “IX” 后 面 加 一 个 “6”， 得 到 “1X6”， 其 结果 当然 是 数字 6 了 。 
大 家 笑 了 ， 因 为 这 个 想法 实在 是 过 分 ， 把 字母 “7 当成 了 数字 1， 字 
母 “X" 看 成 了 乘 号 。 可 谁 又 规定 说 这 是 不 可 以 的 呢 ? 只 要 没 违反 规则 ， 
得 到 6 即 可 ， 如 图 9-6-3 所 示 。 
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图 9-6-3 


管 力 题 的 答案 介绍 完了 。 大 家 会 发 现 ， 看 似 解决 不 了 的 问题 ， 还 真 不 
TERIA ITE, YA SEE T 5 


我 们 都 能 理解 ， 优 秀 排序 算法 的 首要 条 件 就 是 速度 。 于 是 人 们 想 了 许 
许多 多 的 办 法 ， 目 的 束 是 为 了 提高 排序 的 速度 。 而 在 很 长 的 时 间 里 ， 
从 人 发 现 尽 管 各 种 排序 算法 花样 繁多 (比如 前 面 我 们 提 a 到 的 三 种 不 同 
的 排序 算法 ) ， 但 时 间 复 杂 度 都 是 O(n“)， 似 乎 没 法 超越 了 。 此 时 ， 计 


算 机 学 术 界 充斥 着 “排序 算法 不 可 能 突破 Oo“ PHF ET «ΡΙΑΝΙΚ2ΐ 
做 智力 题 的 感觉 一 样 , “不 可 能 ?成 了 主流 。 


终于 有 一 天 ， 当 一 位 科学 家 发 布 超越 了 了 O(n?) 新 排序 算法 后 ， 紧 接着 就 
出 现 了 好 几 种 可 以 超越 O(n*) 的 排序 算法 ， 并 把 内 排序 算法 的 时 间 复 杂 
度 提 升 到 了 Ologn)。“ 不 可 能 超越 O(n*) 彻 底 成 为 了 历史 。 


从 这 里 也 告诉 我 们 ， 做 任何 事 ， 你 解决 不 了 时 ， 想 一 想 “Nothing is 
impossible!”*”， 哩 然 有 点 唯心 ， 但 这 样 的 思维 方式 会 让 你 更 加 深入 地 思 
考 解 决 方案 ， 而 不 是 匆忙 的 放弃 。 


9.6.1 希 尔 排 序 原理 


现在 ， 我 要 讲解 的 算法 叫 希 尔 排序 (ShellSort) 。 希 尔 排序 是 D.L.Shell 
οι που 在 这 之 前 排序 算法 的 时 间 复 杂 度 基 
是 O(n 


2) 的 ， 希 尔 排序 算法 是 突破 这 个 时 间 复 洒 度 的 第 一 批 算 法 之 


我 们 前 一 节 讲 的 直接 插入 排序 ， 应 该 说 ， 它 的 效率 在 某 些 时 候 是 很 高 
的 ， 比 如 ， 我 们 的 记录 本 身 就 是 基本 有 序 的 ， 我 们 只 需要 少量 的 插入 
操作 ， 束 可 以 完成 整个 记录 集 的 排序 工作 ， 此 时 直接 插入 很 高 效 。 还 
有 束 是 记录 数 比较 少时 ， 直 接 插入 的 优势 也 比较 明显 。 可 问题 在 于 ， 
ο πο ， 现 实 中 记录 少 或 者 基本 有 序 都 属于 特殊 情 
Πο 


不 过 别 急 ， 有 条 件 当然 是 好 ， 条 件 不 存在 ， 我 们 创造 条 件 也 是 可 以 去 
做 的 。 于 是 科学 家 希 尔 研究 出 了 一 种 排序 方法 ， 对 直接 插入 排序 改进 
后 可 以 增加 效率 。 


如 何 让 待 排序 的 记录 个 数 较 少 呢 ? 很 容易 想到 的 就 是 将 原本 有 大 量 记 
孙 数 的 记录 进行 分 组 。 分 割 成 者 干 个 子 序列 ， 此 时 每 个 子 序 列 竺 排序 
的 记录 个 数 束 比 较 少 了 ， 然 后 在 这 些 子 序列 内 分 别 进行 直接 插入 排 
序 ， 当 整个 序列 都 基本 有 序 时 ， 注 意 只 是 基本 有 序 时 ， 再 对 全 体 记 录 
进行 一 次 直接 插入 排序 。 


此 时 一 定 有 同学 开始 疑惑 了 。 这 不 对 呀 ， 比 如 我 们 现在 有 序列 是 
{9,1,5,8,3,7,4,6,2} ， 现 在 将 它 分 成 三 组 ，{9,1,5}，{8,3,7}，{4,6,2}， 哪 


怕 将 它们 各 自 排 序 排 好 了 ， 变 成 {1,5,9}，{3,7,8} ，{2,4,6}， 再 合并 它们 
成 {1,5,9,3,7,8,2,4,6} ， 此 时 ， 这 个 序列 还 是 杂乱 无 序 ， 谈 不 上 基本 有 
序 ， 要 排序 还 是 重 来 一 裔 直接 插入 有 序 ， 这 样 做 有 用 吗 ? 需要 强调 一 
下 ， 所 谓 的 基本 有 序 ， 职 是 小 的 关键 字 基 本 在 前 面 ， 大 的 基本 在 后 
面 ， 不 大 不 小 的 基本 在 中 间 ， 像 12,13,6,4,7,5,8,9} 这 样 可 以 称 为 基本 有 
序 了 。 但 像 {1,5,9,3,7,8,2,4,6} 这 样 的 9 在 第 三 位 ，2 在 倒数 第 三 位 就 谈 不 
上 基本 有 序 。 


问题 其 实 也 束 在 这 里 ， 我 们 分 割 等 排序 记录 的 目的 是 减少 待 排序 记录 
的 个 数 ， 并 使 整个 序列 向 基本 有 序 发 展 。 而 如 上 面 这 样 分 完 组 后 就 各 
目 排 序 的 方法 达 不 到 我 们 的 要 求 。 因 此 ， 我 们 需要 采取 跳跃 分 割 的 货 
WS: 将 相距 某 个 “ 增 量 的 记录 组 成 一 个 子 序列 ， 这 样 才 能 保证 在 子 序 
a 分 别 进行 直接 插入 排序 后 得 到 的 结果 是 基 本 有 序 而 不 是 局 部 有 

Ἓ ο 


9.6.2. 项 尔 排 序 算法 


好 了 ， 为 了 能 够 真正 弄 明 日 希 尔 排序 的 算法 ， 我 们 还 是 老 办 法 一 一 模 
拟 计算 机 在 执行 算法 时 的 步骤 ， 还 研究 算法 到 确 是 如 何 进行 排序 的 。 


希 尔 排序 算法 代码 如 下 。 


/* 对 顺序 表 L 作 希 尔 排 序 */ 
void ShellSort(SqList *L) 
i 
μμ abe I 
int increment = L->length; 
do 
a 
/* HSB Fry */ 


increment = increment / 3 + 1; 
for (i = increment + 1; i <= L->length; i++) 
{ 

if (L->r[i] < L->r[i - increment]) 


{ 


/* 需 将 L->r[i] 插 入 有 序 增 量子 表 */ 


/* 暂 存在 L->r[9] */ 


L->r[0] = L->r[i]; 
for (j = i - increment; j > 0 && 


L->r[0] < L->r[j]; j -= increment) 


/* 记录 后 移 ， 查 找 插 入 位 置 */ 


L->r[j + increment] = L->r[j]; 


/* HBA */ 


L->r[j + increment] = L->r[0]; 


} 


while (increment > 1); 


1. 程序 开始 运行 ο ου ο. 9,r[10]= 
ς᾽ 这 就 是 我 们 需要 等 待 排序 的 序列 ， 如 图 9-6-4 所 


示 o 
| α @ ἡ ἃ 8b Ἱ 3 
9-6-4 
2. 第 4 行 ， 变 量 increment 就 是 那个 “ 增 量 *， 我 们 初始 值 让 它 等 于 待 排 序 
的 记录 数 。 


--Δ 


2, 第 5~~19 行 是 一 个 do 循环 ， SEA IER < 件 是 increment 不 大 于 1 时 ， 
实 也 就 是 增 量 为 1 时 就 停止 循环 了 


4. 第 7 行 ， 这 一 句 很 关键 ， 但 也 是 难以 理解 的 地 方 ， 我 们 后 面 还 要 谈 
到 它 ， 先 放 一 放 。 这 里 执行 完成 后 ，increment=9/3+1=4 ° 


5. 第 8~17 行 是 一 个 for 循 环 ，i 从 4+1=5 开 始 到 9 结束 ο 


6. 第 10 行 ， 判 断 L.r[ 订 与 L.rTi-incre-ment] 大 小 ，L.r5]=3 小 于 EL.r[i-incre- 
ment]=L.r[1]=9， 满 足 条 件 ， 第 12 行 ， 将 L.r[5]=3 暂 存 入 L.r[0]。 Έξ13-- 
ο... 了 将 L:r[1H=9 的 值 赋 给 L.r[5]， _ 由 于 循环 的 测量 息 j- 
=increment， 其 实 它 台 循 环 了 一 次 ， 此 时 j=-3。 第 15 行 ， 再 将 L.r[0]=3 赋 
值 给 L.r[j+incre-ment]=L.r[-3+4]=L.r[1]=3。 如 图 9-6-5 所 示 ， 事 实 上 ， 这 
一 段 代 码 束 二 了 一 件 事 ， 束 是 将 第 5 位 的 3 和 第 1 位 的 9 交换 了 位 置 。 


D123 456789 
ΠΠΠΠΗΠΠΗ͂Ι 


increment=4 * 93, χι. 


一 人 


图 9-6-5 


7. 循环 继续 ，i=6，L.r[6]=7>L.r[i-incre-mentlj=L.r[2]=1， 因 此 不 交换 两 
者 效 据 。 如 疼 9-6-6 所 示 。 


ΤΕ 123 45 678 § 
Biisi] 
increment=4 = Lig, ARH 


图 9-6-6 


8. 循环 继续 ，i=7，L.r[7]=4<L.rfi-incre-mentl=L.r[3]=5， 交 换 两 者 数 
据 。 如 图 9-6-7 所 示 。 


FRO 123 45678 4 
ΓΗΠΗΠΠΠΠΠΗ͂ 
increment=4 t ο, 交换 一 

9-6-7 


ο. 循环 继续 ，i=8，L.r[8]=6<L.rfi-incre-mentl=L.r[4]=8， 交 换 两 者 数 
据 。 如 图 9-6-8 所 示 。 


bp 23 45 6 7 


increment=4 t ού, 交换 一 4 


图 9-6-8 


10， 循 环 继续 ，i=9，L.r[9]=2<L.r[i-incre- -ment]= L.r[5]=9, IR EAN 
据 。 注 意 ， 第 13~14 行 是 循环 ， 此 时 还 要 继续 比较 Lz[5] 与 Lr[1] 的 大 
小 ， 因 为 2<23， 所 以 还 要 交换 L.r[5] 与 Lr[1] 的 数据 ， 如 图 9-6-9 所 示 。 


有 标 012345678) 

00o90bggB 

increment=4 t 959, 交换 一 
Eoy 交换 一 4 


图 9-6-9 

最 终 第 一 轮 循环 后 ， 数 组 的 排序 结果 为 图 9-6-10 所 示 。 细 心 的 同学 会 发 
现 ， 我 们 的 数字 1、2 等 小 数字 已 经 在 前 两 位 ， 而 8、9 等 大 数字 已 经 在 
后 两 位 ， 也 就 是 说 ， 通 过 这 样 的 排序 ， 我 们 已 经 让 整个 序列 基本 有 序 


T° 这 其 实 束 古 希 尔 排序 的 精华 所 在 ， 它 将 关键 字 较 小 的 记录 ， 不 是 
一 步 一 步 地 往 前 挪动 ， 而 是 跳跃 式 地 往 前 移 ， 从 而 使 得 每 次 完成 一 轮 
循环 后 ， 整 个 序列 就 朝 着 有 序 坚 实地 迈进 一 步 。 


ΤΕ δ 1 2345678 9 


图 9-6-10 


11. 我 们 继续 ， 在 完成 一 轮 do 循 环 后 ， 此 时 由 于 increment=4>1 因 此 我 
们 需要 继续 do 循环 。 第 7 行 得 到 increment=4/3+1=2。 第 8~17 行 for 循 
环 ，i 从 2+1=3 开 始 到 9 结束 。 当 i=3、4 时 ， 不 用 交换 ， 当 i=5 时 ， 需 要 交 
换 数 据 ， 如 图 9-6-11 所 示 。 


ΤΕ 0 123 45678 5 
ΒΠΠΠΗΠΗΠΩ͂ 
increment=2 2<4， 不 交换 
<6, 不 交换 
人 >3， 交 换 4 


图 9-6-11 
12. 此 后 ，i=6、7、8、9 均 不 用 交换 ， 如 图 9-6-12 所 示 。 
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图 9-6-12 

13， 再 次 完成 一 轮 do 循 环 ，increment=2>1， 再 次 do 循环 ， 第 7 行 得 到 
incre-ment=2/3+1=1， 此 时 这 就 是 最 后 一 轮 do 循 环 了 。 尽 管 第 8 一 17 行 
for 循 环 ，i 从 1+1=2 开 始 到 9 结束 ， 但 由 于 当前 序列 已 经 基本 有 序 ， 可 交 
换 数据 的 情况 大 为 减少 ， 效 率 其 实 很 高 。 如 图 9-6-13 所 示 ， 图 中 箭头 连 
线 为 需要 交换 的 关键 字 。 


ΤΗ δ 1 23 45678 ~9 


Increment=| 5.1 


图 9-6-13 
最 终 完成 排序 过 程 ， 如 图 9-6-14 所 示 。 


标 4 5 6 Ἱ 


图 9-6-14 


9.6.3 项 尔 排 序 复 杂 度 分 析 


通过 这 段 代码 的 剖析 ， 相 信 大 家 有 些 明日 ， 希 尔 排序 的 关键 并 不 古 随 
便 分 组 后 各 自 排 序 ， 而 是 将 相隔 某 个 “ 增 量 ” 的 记录 组 成 一 个 子 序列 ， 
实现 跳跃 式 的 移动 ， 使 得 排序 的 效率 提高 


这 里 “ 增 量 ”的 选取 就 非常 关键 了 。 我 们 在 代码 中 第 7 行 ， 是 用 
increment=increment/3+1; 的 方式 选取 增 量 的 ， 可 究竟 应 该 选取 什么 样 的 
增 量 才 是 最 好 ， 目 前 还 是 一 个 数学 难题 ， 迄 今 为 止 还 没有 人 找到 一 种 


最 好 的 增 量 序 列 。 不 过 大 量 的 研究 表明 ， 当 增 量 序列 为 dlta[k]=21-k+1- 
1 (0<k<t<) 时 ， 可 以 获得 不 错 的 效率 ， 其 时 间 复 杂 度 为 O(n /2)， 要 好 
于 直接 排序 的 Oo“)。 需 要 注意 的 是 ， 增 量 序列 的 最 后 一 个 增 量 值 必须 
等 于 1 才 行 。 另 外 由 于 记录 是 跳跃 式 的 移动 ， 希 尔 排序 并 不 是 一 种 稳定 
的 排序 算法 。 


不 管 怎 么 说 ， 硕 尔 排序 算法 的 发 明 ， 使 得 我 们 终于 突破 了 慢 速 排序 的 
时 代 (超越 了 时 间 复 杂 度 为 O(n?)) ， 之 后 ， 相 应 的 更 为 高 效 的 排序 算 
法 也 就 相继 出 现 了 。 
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我 们 前 面 讲 到 简单 选择 排序 ， 它 在 待 排序 的 n 个 记录 中 选择 一 个 最 小 的 
记录 需要 比较 n-1 次 。 本 来 这 也 可 以 理解 ， 查 找 第 一 个 数据 需要 比较 这 
么 多 次 是 正音 的 ， 否 则 如 何 知道 它 是 最 小 的 记录 5 


可 情 的 是 ， 这 样 的 操作 并 没有 把 每 一 趟 的 比较 结果 保存 下 来 ， 在 后 一 
趟 的 比较 中 ， 有 许多 比较 在 前 一 趟 已 经 做 过 了 ， 但 由 于 前 一 趟 排序 时 
未 保存 这 些 比较 结果 ， 所 以 后 一 趟 排序 时 又 重复 执行 了 这 些 比 较 操 
作 ， 因 而 记录 的 比较 次 数 较 多 。 


如 果 可 以 做 到 每 次 在 选择 到 最 小 记录 的 同时 ， 并 根据 比较 结果 对 其 他 
记录 做 出 相应 的 调整 ， 那 样 排序 的 总 体 效 率 束 会 非常 高 了 。 而 堆 排 友 
(HeapSort) ， 就 是 对 简单 选择 排序 进行 的 一 种 改进 ， 这 种 改进 的 效果 
是 非常 明显 的 。 堆 排序 算法 是 Floyd 和 Williams 在 1964 年 共同 发 明 的 ， 
同时 ， 他 们 发 明了 “ 堆 * 这 样 的 数据 结构 。 


图 9-7-1 


回忆 一 下 我 们 小 时 候 ， 每 别 是 男 同 学 ， 基 本 都 玩 过 县 罗汉 的 恶作剧 。 
通 吊 都 征 匈 把 茶 个 要 整 的 人 按 合 在 地 ， 然 后 六 家 融 一 拥 而 上 扑 了 二 
去 ..….….. 后 采 ? 后 采 当 然 驳 是 一 突 了 之 ， 一 个 恶作剧 而 已 。 不 过 在 西 班 
牙 的 加 泰 罗 尼 亚 地 区 ， 他 们 将 县 罗汉 视 为 了 正 儿 八 经 的 民族 体育 活 
动 ， 如 图 9-7-1 所 示 ， 可 以 想象 当时 场面 的 壮观 。 


登 罗 汉 运 动 是 把 人 挫 在 一 起 ， 而 我 们 这 里 要 介绍 的 * 扒 ?结构 相当 于 把 


数 子 符号 堆 成 一 个 塔 型 的 结构 。 当 然 ， 这 绝 不 是 位 单 的 堆砌 。 大 家 看 
图 9-7-2 所 示 ， 能 够 找到 什么 规律 吗 ? 


ο 0 
LE 
OO OU 
Ὁ) a Wy 


图 9-7-2 


很 明显 ， 我 们 可 以 发 现 它们 都 是 二 叉 树 ， 如 采 观 察 仔细 些 ， 还 能 看 出 
它们 都 是 完全 二 叉 树 。 左 和 铭 中 根 结 点 是 所 有 元 系 中 最 大 的 ， 右 疼 的 根 
结 点 是 所 有 元 于 中 最 小 的 。 再 细 看 看 ， 发 现 左 图 每 个 结 点 都 比 它 的 左 
o 右 图 每 个 结 点 都 比 它 的 左右 孩子 要 小 。 这 了 殉 是 我 们 要 讲 


堆 是 具有 下 列 性 质 的 完全 二 又 树 : 每 个 结 点 的 值 都 大 于 或 等 于 其 左右 
孩子 结 点 的 值 ， 称 为 大 顶 堆 (例如 图 9-7-2 左 图 所 示 ) ; 或 者 每 个 结 点 


ο οσο 左右 孩子 结 点 的 值 ， 称 为 小 项 堆 (例如 图 9-7-2 右 
示 


这 里 需要 注意 从 堆 的 定义 可 知 ， 根 结 点 一 定 是 堆 中 所 有 结 点 最 大 
(小 ) 者 。 较 大 (小 ) 的 结 点 靠近 根 结 点 (但 也 不 绝对 ， 比 如 右 图 小 
顶 堆 中 60、40 均 小 于 70， 但 它们 并 没有 70 靠 近 根 结 点 ) 5 


如 果 按 照 层 序 明 历 的 方式 给 结 点 从 1 开始 编号 ， 则 结 点 之 间 满 足 如 下 天 
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关系。 如 果 完 全 起 记 的 同学 不 妨 去 复习 一 下 。 


如 采 将 图 9-7-2 的 大 顶 堆 和 小 顶 堆 用 层 序 裔 历 存 入 数组 ， 则 一 定 满足 上 
面 的 关系 表达 ， 如 图 9-7-3 所 示 。 
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图 9-7-3 
我 们 现在 讲 这 个 堆 结 构 ， 其 目的 就 是 为 了 堆 排 序 用 的 。 


9.7.1 HFR 


堆 排 序 (Heap Sort) 就 是 利用 堆 (假设 利用 大 顶 堆 ) 进行 排序 的 方 

法 。 它 的 基本 思想 是 ， 将 竺 排序 的 序列 构造 成 一 个 大 顶 堆 。 此 时 ， 整 

个 序列 的 最 大 值 就 是 堆 顶 的 根 结 点 。 将 它 移 走 《其 实 就 是 将 其 与 堆 数 

组 的 末尾 元 素 交 换 ， 此 时 末尾 元 素 就 是 最 大 值 ) ， 然 后 将 剩余 的 n-1 个 
序列 重新 构造 成 一 个 堆 ， 这 样 就 会 得 到 n 个 元 素 中 的 次 大 值 。 如 此 反复 
执行 ， 便 能 得 到 一 个 有 序 序列 了 。 


例如 图 9-7-4 所 示 ， 图 了 是 一 个 大 顶 堆 ，90 为 最 大 值 ， 将 90 与 20 ORE 
THA) 互 换 ， 如 图 @ 所 示 ， 此 时 90 就 成 了 整个 堆 序 列 的 最 后 一 个 元 

素 ， 将 20 经 过 调整 ， 使 得 除 90 以 外 的 结 点 继续 满足 大 顶 堆 定义 (所 有 
结 点 都 大 于 等 于 其 子 孩 子 ) ， 见 图 @@， 然 后 再 考虑 将 30 与 80 互 换 ..……… 


图 9-7-4 


相信 大 家 有 些 明白 堆 排 序 的 基本 思想 了 ， 不 过 要 实现 它 还 需要 解决 两 
个 问题 : 1. 如 何 由 一 个 无 序 序列 构建 成 一 个 堆 ? 2. 如 采 在 输出 堆 顶 元 


素 后 ， 调 整 剩余 元 素 成 为 一 个 新 的 堆 ? 
要 解释 清楚 它们 ， 让 我 们 来 看 代码 。 


/* 对 顺序 表 L 进 行 堆 排序 */ 


void HeapSort(SqList *L) 
τ 


ΗΕ abe 


/* 把 L 中 的 r 构 建成 一 个 大 顶 堆 */ 


ποπ αι length, 2 απ θα) 
HeapAdjust(L, i, L->length); 


for (i = L->length; i > 1; i--) 


if 
/* 将 堆 顶 记录 和 当前 未 经 排序 子 序列 的 最 后 一 个 记录 交换 */ 
swap CE ee πλ 
/* 将 L->r[1. .i-1] 重 新 调整 为 大 顶 堆 */ 
HeapAdjust(L, 1, i - 1); 

} 


从 代码 中 也 可 以 看 出 ， 整 个 排序 过 程 分 为 两 个 for 循 环 。 第 一 个 循环 要 

完成 的 瓯 是 将 现在 的 待 排序 序列 构建 成 一 个 大 顶 堆 。 第 二 个 循环 要 完 

A a ,.,..- 并 且 再 调整 其 
y WHE ο 


假设 我 们 要 排序 的 序列 是 {50,10,90,30,70,40,80,60,20}， 那 么 
L.length=9， 第 一 个 for 循 环 ， 代 人 码 第 4 行 ， i 是 从 =4 开 始 ，4 一 3 一 2 一 1 的 
变量 变化 。 为 什么 不 是 从 1 到 9 或 者 从 9 到 1， 而 是 从 4 到 1 呢 ? 其 实 我 们 
看 了 图 9-7-5 就 明白 了 ， 它 们 都 有 什么 规律 ? 它们 都 是 有 和 孩子 的 结 点 。 
注意 灰色 结 点 的 下 标 编号 就 是 1、2、3、4。 


ὃ ) 


图 9-7-5 

我 们 所 谓 的 将 竺 排序 的 序列 构建 成 为 一 个 大 顶 堆 ， 其 实 就 是 从 下 往 
上 、 从 右 到 左 ， 将 每 个 非 终 端 结 点 〈 非 叶 结 点 ) 当 作 根 结 点 ， 将 其 和 
其 子 树 调整 成 大 顶 堆 。i 的 4-=3-2-1 的 变量 变化 ， 其 实 也 就 是 30， 
90，10、50 的 结 点 调整 过 程 。 
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HeapAdjust 〈 堆 调整 ) 函数 是 如 何 实现 的 。 


/* 已 知 L->r[s..m] 中 记录 的 关键 字 除 L->r[s] 之 外 


均 满 足 堆 的 定义 */ 


/* 本 函数 调整 L->r[s] 的 关键 字 ， 使 L->r[s..m] 成 


为 一 个 大 顶 堆 */ 


void HeapAdjust(SqList *L,int s,int πι) 
τ 

int temp, 1; 

temp = L->r[s]; 


/* 沿 关键 字 较 大 的 孩子 结 点 向 下 筛选 */ 


for 45239) j <= m; j *= 2) 
{ 


SP CG) ΠΕΙ πμ μπιν η) 


/* j 为 关键 字 中 较 大 的 记录 的 下 标 */ 


tly 
if (temp >= L->r[j]) 


/* rc 应 插入 在 位 置 s 上 */ 


break; 
L->r[s] = L->r[j]; 
ολ ος 
} 
{ΛΗΔΑ */ 


L->r[s] = temp; 


1. HARBIN, 5-4, m=9, fEAAISGLIst#B RAY 
length=9,r[10]={0,50,10,90,30,70,40,80,60,20} 5 


2. 第 4 行 ， 将 L.r[s]=L.r[4]=30 赋 值 给 temp， 如 图 9-7-6 所 示 。 
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图 9-7-6 
3. 第 5~13 行 ， 循 环 遍 历 其 结 点 的 孩子 。 这 里 j 变 量 为 什么 是 从 2 6748 


WE? RAMPS xej =2 弟 增 呢 ? 原 因 还 古 二 叉 树 的 性 质 5， 因 为 我 们 这 株 
是 完全 二 又 树 ， 当 前 结 点 序号 是 s， 其 左 孩 子 的 序号 一 定 是 2s， 右 孩子 


7e7u E— 


的 序号 一 定 是 2s+1， 它 们 的 孩子 当然 也 是 以 2 的 位 数 序号 增加 ， 因 此 j 变 
量 才 是 这 样 循 环 。 

4. 第 7~8 行 ， 此 时 j=2*4=8，j<m 说 明 它 不 是 最 后 一 个 结 点 ， 如 有 果 L.r[j] 
<Lr[j+1l， 则 说 明 碟 孩子 小 于 右 孩 子 。 我 们 的 目的 是 要 找到 较 大 值 ， 当 
然 需 要 让 j+1 以 便 变 成 指 同 右 孩 子 的 下 标 。 当 前 30 的 左右 孩子 是 60 和 
20， 并 不 满足 此 条 件 ， 因 此 j 还 是 8 。 


5， 第 9~10 行 ，temp=30，L:r[j]=60， 并 不 满足 条 件 。 

6. 第 11~12 行 ， 将 60 赋 值 给 L.r[4]， 并 令 s=j=8。 也 束 是 说 ， 当 前 算 
出 ， 以 30 为 根 结 点 的 子 二 又 树 ， 当 前 最 大 值 是 60， 在 第 8 的 位 置 。 注 意 
此 时 EL.r[4] 和 L.r[8] 的 值 均 为 60。 

7. 再 循环 因为 j=2*j=16，m=9，j>m， 因 此 跳出 循环 。 


8. 第 14 行 ， 将 temp=30 赋 值 给 L.r[s]=L.r[8]， 完 成 30 与 60 的 交换 工作 。 
如 图 9-7-7 所 示 。 本 次 函数 调用 完成 。 
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图 9-7-7 


9. 再 次 调用 HeapAdjust， 此 时 s=3，m=9。 第 4 行 ，temp=L.r[3]=90， 第 
7~-8 行 ， 由 于 40<80 得 到 j+1=2*s+1=7。9~-10 行 ， 由 于 90>80， 因 此 退 
出 循环 ， 最 终 本 次 调用 ， 整 个 序列 未 发 什么 改变 。10. 再 次 调用 
HeapAdjust， 此 时 s=2，m=9。 第 4 行 ，temp=L.r[2]=10， 第 7 一 8 行 ， 
60<70， 使 得 j=5。 最 终 本 次 调用 使 得 10 与 70 进 行 了 互 换 ， 如 图 9-7-8 所 
ZN ο 
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图 9-7-8 


11. 再 次 调用 HeapAdjust， 此 时 s=1，m=9。 第 4 行 ，temp=L.r[1]=50， 
第 7~-8 行 ，70<90， 使 得 j=3。 第 11~-12 行 ，Lr[H] 被 赋值 了 90， 并 且 
s=3， 再 循环 ， 由 于 2j=6 并 未 大 于 mm， 因 此 再 次 执行 循环 体 ， 使 得 L.r[3] 
被 赋值 了 80， 完 成 循环 后 ，L.[7] 被 赋值 为 0， 最 终 本 次 调用 使 得 50、 
90、80 进 行 了 轮换 ， 如 图 9-7-9 所 示 。 
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图 9-7-9 

到 此 为 止 ， 我 们 构建 大 顶 堆 的 过 程 算 是 完成 了 ， 也 就 是 HeapSort 函 数 的 
第 4~5 行 循环 执行 完毕 。 或 许 是 有 点 复杂 ， 如 果 不 明 白 ， 多 试 着 模拟 
计算 机 执行 的 方式 走 几 遍 ， 应 该 就 可 以 理解 其 原理 。 


接 下 来 HeapSort 函 数 的 第 6 一 11 行 束 是 正式 的 排序 过 程 ， 由 于 有 了 前 面 
的 充分 准备 ， 其 实 这 个 排序 就 比较 轻松 了 。 下 面 是 这 部 分 代码 。 


for (i = L->length; i > 1; i--) 


i 


/* 将 堆 顶 记录 和 当前 未 经 排序 子 序列 的 最 后 一 个 记录 交换 */ 


swap(L,1,i); 


/* 将 L->r[1. .i-1] 重 新 调整 为 大 顶 堆 */ 


HeapAdjust(L,1,i-1); 


} 


1. 当 i=9 时 ， 第 8 行 ， 交 换 20 与 90， 第 9 行 ， 将 当前 的 根 结 点 20 进 行 大 项 
堆 的 调整 ， 调 整 过 程 和 刚才 流程 一 样 ， 找 到 它 左 右 子 结 点 的 较 大 值 ， 
互 换 ， 再 找到 其 子 结 点 的 较 大 值 互 换 。 此 时 序列 变 为 
{80,70,50,60,10,40,20,30,90}， 如 图 9-7-10 所 示 。 


图 9-7-10 


2. 当 i=8 时 ， 交 换 30 与 80， 并 将 30 与 70 交 换 ， 再 与 60 交 换 ， 此 时 序列 变 
为 {70,60,50,30,10,40,20,80,90}， 如 图 9-7-11 所 示 。 


3. 后 面 的 变化 完全 类 似 ， 不 解释 ， 只 看 图 (图 9-7-12) 9 
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图 9-7-12 
最 终 就 得 到 一 个 完全 有 序 的 序列 了 。 
9.7.2“” 扒 排 序 复 杂 度 分 析 
堆 排 序 的 效率 到 底 有 多 高 呢 ? 我 们 来 分 析 一 下 。 
它 的 运行 时 间 主 要 是 消耗 在 初始 构建 堆 和 在 重建 堆 时 的 反复 盘 选 上 。 
在 构建 堆 的 过 程 中 ， 因 为 我 们 是 完全 二 又 树 从 最 下 层 最 右边 的 非 终端 
结 点 开始 构建 ， 将 它 与 其 孩子 进行 比较 和 者 有 必要 的 互 换 ， 对 于 每 个 
非 终端 结 点 来 说 ， 其 实 最 多 进行 两 次 比较 和 互 换 操作 ， 因 此 整个 构建 
堆 的 时 间 复 杂 度 为 O(0nD)。 
在 正式 排序 时 ， 第 i 次 取 堆 顶 记录 重建 堆 需 要 用 O(logi) 的 时 间 (完全 二 
叉 树 的 某 个 结 点 到 根 结 点 的 距离 为 ; ， 并 且 需 要 取 n-1 次 堆 顶 记录 ， 因 
此 ， 重 建 堆 的 时 间 复 杂 度 为 Onlogn)。 


所 以 尽 体 来 说 ， 堆 排序 的 时 间 复 杂 度 为 O(nlogn)。 由 于 堆 排 序 对 原始 记 
录 的 排序 状态 并 不 敏感 ， 因 此 它 无 论 是 最 好 、 最 坏 和 平均 时 间 复 杂 度 


均 为 OOnlogn)。 这 在 性 能 上 显然 要 远 远 好 过 于 冒 泡 、 tal EP > EA 
AKOM? ) 的 时 间 复 杂 度 了 。 


空间 复杂 度 上 ， 它 只 有 一 个 用 来 交换 的 暂 存 单元 ， 也 非常 的 不 错 。 不 
比较 与 交换 是 跳跃 式 进行 ， 因 此 堆 排 序 也 是 一 种 不 稳定 
J 排序 方法 。 


男 外 ， 由 于 初始 构建 堆 所 需 的 比较 次 数 较 多 ， 因 此 ， 它 并 不 适合 待 排 
序 序列 个 数 较 少 的 情况 。 


9.8 ”归并 排序 


前 面 我 们 讲 了 堆 排 序 ， 因 为 它 用 到 了 完全 二 义 树 ， 充 分 利用 了 完全 二 
又 树 的 深度 是 log >n|+1 的 特性 ， 所 以 效率 比较 高 。 不 过 堆 结构 的 设计 
本 身 是 比较 复杂 的 ， 老 实说 ， 能 想 出 这 样 的 结构 融 挺 不 容易 ， 有 没有 
更 直接 简单 的 办 法 利用 完全 二 又 树 来 排序 呢 ? 当然 有 。 


先 来 举 一 个 例子 。 你 们 知道 高 考 一 本 、 二 本 、 专 科 分 数 线 是 如 何 划 分 
出 来 的 吗 ? 


简单 地 说 ， 如 果 各 高 校本 科 专 业 在 某 省 高 三 理科 学 生 中 计划 招收 1 万 

名 ， 那 么 将 全 省 参加 高 考 的 理科 学 生 分 数 倒 排序 ， 第 1 万 名 的 总 分 数 就 

是 当年 本 科 生 的 分 数 线 (现实 可 能 会 比 这 复杂 ， 这 里 简化 之 ) 。 也 就 

是 说 ， 即 使 你 是 你 们 班级 第 一 、 甚 至 年 级 第 一 名 ， 如 有 果 你 没有 上 分 数 

να ο ος URE FEAR RE { ΞΕ ΓΑ. 
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换 句 话说 ， 所 谓 的 全 省 排名 ， 其 实 也 就 是 每 个 市 、 每 个 县 、 每 个 学 
. ` 每 个 班级 的 排名 合并 后 再 排名 得 到 的 。 注 意 我 这 里 用 到 了 合并 一 
词 。 


我 们 要 比 较 两 个 学 生 的 成 绩 高 低 是 很 容易 的 ， 比 如 甲 比 乙 分 数 低 ， 两 
比 丁 分 数 低 。 那 么 我 们 也 融 可 以 很 容易 得 到 甲乙 丙 本 合并 后 的 成 绩 排 
名 ， 同 样 的 ， 戊 己 庚 对 的 排名 也 容易 得 到 ， 由 于 他 们 两 组 分 别 有 序 
了 ， 把 他 们 八 个 学 生成 绩 合 并 有 序 也 是 很 容易 做 到 的 了 ， 继 续 下 

去 .…... 最 终 完 成 全 省 学 生 的 成 绩 排名 ， 此 时 高 考 状 元 也 就 诞生 了 。 


为 了 更 清晰 地 说 清楚 这 里 的 思想 ， 大 家 来 看 图 9-8-1 所 示 ， 我 们 将 本 是 

无 序 的 数组 序列 {16,7,13,10,9,15,3,2,5,8,12,1,11,4,6,14}， 通 过 两 两 合并 

排序 后 再 合并 ， 最 终 获 得 了 一 个 有 序 的 数组 。 注 意 仔细 观察 它 的 形 

状 ， 你 会 发 现 ， 它 像 极 了 一 棵 倒置 的 完全 二 又 树 ， 通 常 涉及 到 完全 二 

效率 一 般 都 不 低 的 一 一 这 就 是 我 们 要 讲 的 归并 
FI ο 
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图 9-8-1 
9.8.1 ”归并 排序 算法 


归并 "一 词 的 中 文 含义 就 是 合并 、 并 入 的 意思 ， 而 在 数据 结构 中 的 定义 
是 将 两 个 或 两 个 以 上 的 有 序 表 组 合成 一 个 新 的 有 序 表 。 


归并 排序 (Merging Sort) 就 是 利用 归并 的 思想 实现 的 排序 方法 。 它 的 

原理 是 假设 初始 序列 含有 n 个 记录 ， 则 可 以 看 成 是 n 个 有 序 的 子 序列 ， 

每 个 子 序列 的 长 度 为 1， 然 后 两 两 归并 ， 得 到 |n/2| (|x| 表 示 不 小 于 x 的 最 

小 整数 ) 个 长 度 为 2 或 1 的 有 序 子 序列 ， 再 两 两 归并 ， 如 此 重 

ο ο. 个 长 度 为 的 有 序 序列 为 止 ， 这 种 排序 方法 称 为 2 路 归 
Ἓ ο 


好 了 ， 有 了 对 归并 排序 的 初步 认识 后 ， 我 们 来 看 代码 。 


/* 对 顺序 表 L 作 归并 排序 */ 


void MergeSort(SqList *L) 
{ 


MSort(L->r, L->r, 1, L->length); 


一 句 代 码 ， 别 奇怪 ， 它 只 是 调用 了 另 一 个 函数 而 已 。 为 了 与 前 面 的 排 
序 算法 统一 ， 我 们 用 了 同样 的 参数 定义 SqList *L， 由 于 我 们 要 讲解 的 
归并 排序 实现 需要 用 到 递归 调用 ， 因 此 我 们 外 封装 了 一 个 函数 。 假 设 
现在 要 对 数组 {50,10,90,30,70,40,80,60,20} 进 行 排序 ，L.length=9， 我 现 
来 看 看 MSort 的 实现 ο 


/* 将 SR[s. .t] 归 并 排序 为 TR1[s..t] */ 


ὑ0πΜ5ΟΠΕ(ΠΈΣ SR πε πεί Π πι ο net) 
Ai 

int m; 

int TR2[MAXSIZE + 1]; 

αρ (ες SS 15) 

TRi[s] = SR[s]; 
else 
i 


/* 将 SR[s. .t] 平 分 为 SR[s..m] 和 SR[m+1. .t] */ 


ME 


/* 递归 将 SR[s. .m] 归 并 为 有 序 的 TR2[s..m] */ 


MSomuCSR ΠΙΟ Sm 


/* 递归 将 SR[m+1. .t] 归 并 为 有 序 TR2[m+1..t] */ 


MSort(SR，TR2，m + 1, t); 
/* 将 TR2[s..m] 和 TR2[m+1..t] */ 


/* 归并 到 TR1[s..t] */ 


Merge(TR2,TR1, 5, m, t); 


} 


1. MSort 被 调用 时 ，SR 与 TR1 都 是 {50,10,90,30,70,40,80,60,20}，s=1 
t=9， 最 终 我 们 的 目的 束 古 要 将 TR1 中 的 数组 排 好 顺序 。 


2. 第 5 行 ， 显然 s 不 等 于 t， 执 行 第 8~13 行 语句 块 。 

3. 第 9 行 ，m=(1+9)/2=5。m 就 是 序列 的 正中 间 下 标 。 

4. 此 时 第 10 行 ， 调 用 “MSort(SR,TR2,1,5);” 的 目标 就 是 将 数组 SR 中 的 第 
1 一 5 的 关键 字 归 并 到 有 序 的 TR2 (调用 前 TR2 为 空 数组 ， 第 11 行 ， 调 
用 “MSort(SR,TR2,6,9);” 的 目标 就 是 将 数组 SR 中 的 第 6 一 9 的 天 键 字 归并 


到 有 序 的 TR2。 也 就 是 说 ， 在 调用 这 两 句 代 码 之 前 ， 代 码 已 经 准备 将 数 
组 分 成 了 两 组 了 ， 如 图 9-8-2 所 示 。 


下 标 5 6 7 


PT 


TR? 


图 9-8-2 


5. 第 12 行 ， 函 数 Merge 的 代码 细节 一 会 再 讲 ， 调 
用 “Merge(TR2,TR1,1,5,9);” 的 目标 其 实 束 是 将 第 10 和 11 行 代码 获得 的 数 


组 TR2 (注意 它 是 下 标 为 1 一 5 和 6~-9 的 关键 字 分 别 有 序 ) 归并 为 TR1， 
此 时 相当 于 整个 排序 就 已 经 完成 了 ， 如 图 9-8-3 所 示 。 
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图 9-8-3 


再 来 看 第 10 行 递归 调用 进去 后 ，s=1，t=5，m=(1+5)/2=3。 此 时 相当 
ματ. 为 三 个 和 两 个 。 继 续 递归 进去 ， 直 到 细 分 为 一 个 记录 
填 入 TR2， 此 时 s 与 t 相 等 ， 递 归 返 回 ， 如 图 9-8-4 的 左 图 所 示 。 每 次 递归 
返回 后 都 会 执行 当前 递归 函数 的 第 12 行 ， 将 TR2 归 并 到 TR1 中 ， 如 图 9- 
8-4 的 右 图 所 示 ， 最 终 使 得 当前 序列 有 序 。 


图 9-8-4 
7. 同样 的 第 11 行 也 是 类 似 方式 ， 如 图 9-8-5 所 示 。 


图 9-8-5 


8. 此 时 也 就 是 刚才 所 讲 的 最 后 一 次 执行 第 12 行 代码 ， 将 
{10,30,50,70,90} 与 {20,40,60,80} 归 并 为 最 终 有 序 的 序列 。 


可 以 说 ， 如 琳 对 逮 归 函数 的 运行 方式 理解 比较 透 的 话 ，MSort 画 数 还 是 
很 好 理解 的 。 我 们 来 看 看 整个 数据 变换 示意 图 ， 如 图 9-8-6 所 示 。 
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图 9-8-6 
现在 我 们 来 看 看 Merge 函 数 的 代码 是 如 何 实现 的 。 


/* 将 有 序 的 SR[i. .m] 和 SR[m+1. .n] 归 并 为 有 序 的 


τη Πα 
void Merge(ant SRI int TRE int 1, Int m, int n) 
{ 


e gi Koes 


/* 将 SR 中 记录 由 小 到 大 归并 入 TR */ 


for (j =m+4i1, k =i; i <= m && j <= n; k++) 


{ 
if (SR[i] < SR[j]) 
TR[k] = SR[i++]; 
else 
TR[k] = SR[j++]; 
} 
wes 
i 
for (1 = 0; 1 <= - i; 111) 
/* 将 剩余 的 SR[I. ,m] 复制 到 TR_ */ 
TR[k + 1]=SR[i + 1]; 
} 
3 κε 
{ 
πορεια ll ea ee) 
/* 将 剩余 的 SR[j..n] 复 制 到 TR */ 
TR[k + 1] = SR[j + 1]; 
} 


1. 假设 我 们 此 时 调用 的 Merge 就 是 将 {10,30,50,70,90} 与 {20,40,60,80} 归 
并 为 最 终 有 序 的 序列 ， 因 此 数组 SR 为 {10,30,50,70,90,20,40,60,80}， 
i=1, m=5, n=9 ° 


2. 第 4 行 ，for 循 环 ，j 由 m+1=6 开 始 到 9，i 由 1 开始 到 5，k 由 1 开始 每 次 
加 1，k 值 用 于 目标 数组 TR 的 下 标 。 


3. 第 6 行 ，SR[i]=SR[1]=10，SR[j]=SR[6]=20，SR[i]<SR[j]， 执 行 第 7 
行 ，TR[k]=TR[1]=10， 并 且 i++。 如 图 9-8-7 所 示 。 
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图 9-8-7 


4. 再 次 循环 ，k++ 得 到 k=2，SR[i]=SR[2]=30，SR[j]=SR[6]=20， 
SR[i]>SR[j]， 执 行 第 9 行 ，TR[kJ]=TR[2]=20， 并 且 j++， 如 图 9-8-8 所 
Ἣν ο 
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图 9-8-8 


5. 再 次 循环 ，k++ 得 到 k=3，SR[=SR[2]=30，SRI[j]=SR[7]=40，SRrj] 
<SR[j]， 执 行 第 7 行 ，TR[k]=TR[3]=30， 并 且 i++， 如 图 9-8-9 所 示 。 
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图 9-8-9 


Be POR eS TRIAS SREP, 一 直到 j++ 后 ，j=10， 大 于 9 退出 循环 ， 如 
ΕΝ 0 所 示 
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图 9-8-10 

7. 第 11~20 行 的 代码 ， 其 实 就 将 归并 剩 下 的 数组 数据 ， 移 动 到 TR 的 后 
面 。 当 前 k=9，i=m=5， 执 行 第 13~20 行 代码 ，for 循 环 1=0， 
TR[k+1]=SR[i+1]=90， 大 功 告 成 。 


就 这 样 ， 我 们 的 归并 排序 束 算 是 完成 了 一 次 排序 工作 ， 怎 么 样 ， 和 堆 
排序 比 ， 古 不 古 要 简单 一 些 呢 ? 


9.8.2 ”归并 排序 复杂 度 分 析 


我 们 来 分 析 一 下 归并 排序 的 时 间 复 洒 度 ， 一 趟 归并 需要 将 SR[1]~~SR[n] 
中 相 邻 的 长 度 为 h 的 有 序 序列 进行 两 两 归并 。 并 将 结果 放 到 TR1[1]~ 
TR1[n] 中 ， 这 需要 将 待 排序 序列 中 的 所 有 记录 扫描 一 裔 ， 因 此 耗费 O(n) 
时 间 ， 而 由 完全 二 又 树 的 深度 可 知 ， 整 个 归并 排序 需要 进行 次 ， 因 
此 ， 总 的 时 间 复 杂 度 为 Onlogm)， 而 且 这 有 是 归并 排序 算法 中 最 好 、 最 
坏 、 平 均 的 时 间 性 能 。 


由 于 归并 排序 在 归并 过 程 中 需要 与 原始 记录 序列 同样 数量 的 存储 空间 
存放 归并 结果 以 及 递归 时 深度 为 log 


2n 的 栈 空间 ， 因 此 空间 复杂 度 为 O(n+logn)。 


另外， 对 代码 进行 仔细 研究 ， 发 现 Merge 函 数 中 有 if(SR[i]<SR[j) 语 句 ， 
ΛΜ ΤΙ 种 稳定 的 
予 算法 。 


也 就 是 说 ， 归 并 排序 是 一 种 比较 占用 内 存 ， 但 却 效率 高 且 稳 定 的 算 

法 Q 

9.8.3” 非 递归 实现 归并 排序 

我 们 常 说 ,，“ 没 有 最 好 ， 只 有 更 好 。” 归 并 排序 大 量 引 用 了 递归 ， 尺 管 
在 代码 上 比较 清晰 ， 容 易 理 解 ， 但 这 会 造成 时 间 和 空间 上 的 性 能 损 

耗 。 我 们 排序 追求 的 就 是 效率 ， 有 没有 可 能 将 递归 转化 成 迭代 呢 ? 结 
论 当然 是 可 以 的 ， 而 且 改 动 之 后 ， 性 能 上 进一步 提高 了 ， 来 看 代码 。 


/* 对 顺序 表 L 作 归并 非 递归 排序 */ 


void MergeSort2(SqList *L) 
it 


/* 申请 额外 空间 3/ 


int * TR = (int *)malloc(L->length * sizeof(int)); 
απο κα. ης 

while (k < L->length) 

{ 


MergePass(L->r, TR, k, L->length); 


/"ΓΒΖΙ ΚΕΙ */ 

k=2* κ; 

MergePass(TR, L->r, k, L->length); 
/* 子 序列 长 度 加 倍 “/ 


k = 2 * k; 
} 


1. 程序 开始 执行 ， 数 组 LL 为 {50,10,90,30,70,40,80,60,20}，L.length=9 5 
ο 第 3 行 ， 我 们 事先 申请 了 额外 的 数组 内 存 空间 ， 用 来 存放 归并 结 

3. 第 5~11 行 ， 是 一 个 while 循 环 ， 目 的 是 不 断 地 归并 有 序 序列 。 注 意 k 
aes 第 8 行 与 第 10 行 ， 在 不 断 循环 中 ， 它 将 由 1 2 一 4 一 8 一 16， 
ν ή κ o 


4. 第 7 行 ， 此 时 k=1，MergePass 函 数 将 原来 的 无 序数 组 两 两 归并 入 TR 
(此 函数 代码 稍 后 再 讲 ) ， 如 图 9-8-11 所 示 。 


[el Be le 
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图 9-8-11 


5. 第 8 行 ，k=2。 


6. 第 9 行 ，MergePass 函 数 将 TR 中 已 经 两 两 归并 的 有 序 序列 再 次 归并 回 
数组 L.r 中 ， 如 图 9-8-12 所 示 。 


图 9-8-12 


7. 第 10 行 ，k=4， 因 为 k<9， 所 以 继续 循环 ， 再 次 归并 ， 最 终 执行 完 第 
7~10 行 ，k=16， 结 束 循环 ， 完 成 排序 工作 ， 如 图 9-8-13 所 示 。 


DOO 
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图 9-8-13 

从 代码 中 ， 我 们 能 够 感受 到 ， 非 递归 的 迭代 做 法 更 加 直截了当 ， 从 最 
小 的 序列 开始 归并 直至 完成 。 不 需要 像 归 并 的 递归 算法 一 样 ， 需 要 先 
拆 分 递归 ， 再 归并 退出 递归 。 


现在 我 们 来 看 MergePass 代 码 是 如 何 实 现 的 。 


/* 将 SR[] 中 相 邻 长 度 为 s 的 子 序列 两 两 归并 到 TR[] */ 


void MergePass(int SR[], int TR[], int 5, int n) 
ie 

alge ah ἘΞ ae 

EME Jy 


while (i <= n-2* s + 1) 


{ 
/* 两 两 归并 */ 
Merge (SR πα, ο ΠΕ is ea) 
πι αἱ “πη Ὁ) 5 

} 


/* 归并 最 后 两 个 序列 */ 


chp (en) 


MERGE (SRE ΠΕ πο πο ο πο πο 


/* 若 最 后 只 剩 下 单个 子 序列 “7 


else 
OLE (Ci) Sales) Sil hee), 


TREJ] = SR(I]; 


1. 程序 执行 。 我 们 第 一 次 调用 “MergePass(L.r,TR,k,L.length);:”"， 此 时 
LI 是 初始 无 序 状态 ，TR 为 新 申请 的 空 数组 ，k=1，L.length=9 5 


2. 第 5~9 行 ， 循 环 的 目的 就 两 两 归并 ， 因 s$s=1，n-2xs 十 1=8， 为 什么 循 
环 i 从 1 到 8， 而 不 是 9 呢 ? 就 是 因为 两 两 归并 ， 最 终 9 条 记录 定 会 镜 下 


Aes, AEAII 


3. 第 7 行 ，Merge 函 数 我 们 前 面 已 经 详细 讲 过 ， 此 时 i=1，i 十 s-1=1，i 十 

2xs-1=2。 也 就 是 说 ， 我 们 将 SR ( 即 L.r) 中 的 第 一 个 和 第 二 个 记录 归并 

到 TR 中 ， 然 后 第 8 行 ，i=i 十 2xs=3， 再 循环 ， 我 们 就 是 将 第 三 个 和 第 四 

τ 一 直到 第 七 和 第 八 个 记录 完成 归并 ， 如 图 9-8-14 
不 ο 


Mi ἡ 


图 9-8-14 


4. 第 10~14 行 ， 主 要 是 处 理 最 后 的 尾数 ， 第 11 行 是 说 将 最 后 剩 下 的 多 
个 记录 归并 到 TR 中 。 不 过 由 于 i=9，n-s 十 1=9， 因 此 执行 第 13 一 14 行 ， 
将 20 放 入 到 TR 数 组 的 最 后 ， 如 图 9-8-15 所 示 。 


图 9-8-15 

5. 再 次 调用 MergePass 时 ，s=2， 第 5~-9 行 的 循环 ， 由 第 8 行 的 i=i 十 2xs 
可 知 ， 此 时 i 就 是 以 4 为 增 量 进行 循环 了 ， 也 就 是 说 ， 是 将 两 个 有 两 个 记 
孙 的 有 序 序 列 进行 归并 为 四 个 记录 的 有 序 序列 。 最 终 再 将 最 后 剩 下 的 

第 九条 记录 “20” 插 入 TR， 如 图 9-8-16 所 示 。 
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图 9-8-16 


6. 后 面 的 类 似 ， 略 。 


非 递 归 的 适 代 方法 ， 避 免 了 递归 时 深度 为 log zn 的 栈 空 间 ， 空 间 只 是 用 
到 申请 归并 临时 用 的 TR 数 组 ， 因 此 空间 复杂 度 为 0m， 并 且 避 免 递归 
也 在 时 间 性 能 上 有 一 定 的 提升 ， 应 该 说 ， 使 用 归并 排序 时 ， 尽 量 考 虑 
用 非 递归 方法 。 


9.9 ”快速 排序 


终于 我 们 的 高 手 要 登场 了 ， 如 采 将 来 你 工作 后 ， 你 的 老板 要 让 你 写 个 
排序 算法 ， 而 你 会 的 算法 中 竟然 没有 快速 排序 ， 我 想 你 还 是 不 要 声 
LE ο 


事实 上 ， 不 论 是 C++ STL ` Java SDK 或 者 .NETFrameWork SDK 等 开发 
工具 包 中 的 源 代 码 中 都 能 找到 它 的 某 种 实现 版 本 。 


快速 排序 算法 最 早 由 图 灵 奖 获得 者 TonyHoare 设 计 出 来 的 ， 他 在 形式 化 
方法 理论 以 及 AL-GOL60 编 程 语言 的 发 明 中 都 有 日 越 的 页 献 ， 是 上 世纪 
ο. eee a ος 
FAZIS o 


更 牛 的 是 ， 我 们 现在 要 学 习 的 这 个 快速 排序 算法 ， 被 列 为 20 世 纪 十 大 
算法 之 一 。 我 们 这 些 玩 编程 的 人 还 有 什么 理由 不 去 学 习 它 呢 ? 


希 尔 排 序 相当 于 直接 插入 排序 的 升级 ， 它 们 同属 于 插入 排序 类 ， 堆 排 
序 相 当 于 简单 选择 排序 的 升级 ， 它 们 同属 于 选择 排序 类 。 而 快速 排序 
其 实 束 是 我 们 前 面 认为 最 慢 的 冒 泡 排序 的 升级 ， 它 们 都 属于 交换 排序 
类 。 即 它 也 是 通过 不 断 比 较 和 移动 交换 来 实现 排序 的 ， 只 不 过 它 的 实 
现 ， 增 大 了 记录 的 比较 和 移动 的 距离 ， 将 关键 字 较 大 的 记录 从 前 面 直 
接 移 动 到 后 面 ， 天 键 字 较 小 的 记录 从 后 面 直接 移动 到 表面， 从 而 减少 
了 忌 的 比较 次 数 和 移动 交换 次 数 。 


9.9.1 快速 排序 算法 


快速 排序 (Quick Sort) 的 基本 思想 是 :; 通过 一 趟 排序 将 待 排 记录 分 割 
成 独立 的 两 部 分 ， 其 中 一 部 分 记录 的 关键 字 均 比 另 一 部 分 记录 的 关键 


τ τ 可 分 别 对 这 两 部 分 记录 继续 进行 排序 ， 以 达到 整个 序列 有 序 
从 字面 上 感觉 不 出 它 的 好 处 来 。 假 设 现在 要 对 数组 
{50,10,90,30,70,40,80,60,20} 进 行 排序 。 我 们 通过 代码 的 讲解 来 学 习 快 
速 排 序 的 精妙 。 


我 们 来 看 代码 。 


/* 对 顺序 表 L 作 快速 排序 */ 
void QuickSort(SqList *L) 
{ 


QSort(L, 1, L->length); 


Mae ACIS, MURR EE, RT BRIA, AERIS 
Be ΓΕΝ 5 PUTER A QSortHy SH 5 


/* 对 顺序 表 L 中 的 子 序列 L->r [low. .high] 作 快速 排 
ΠΤ 
void QSort(SqList *L, int low, int high) 
τ 

int pivot; 

if (low < high) 

i 


/* ¥%L->r[low..high]—7A=, */ 


/* 算出 枢 轴 值 pivot */ 


pivot = Partition(L, low, high); 


/* 对 低 子 表 递 归 排 序 */ 


QSort(L, low, pivot - 1); 


/* 对 高 子 表 递 归 排 序 */ 


οδοπΕς ινα t oh, 


} 


从 这 里 ， 你 应 该 能 理解 前 面 代码 “QSort(L,1,L->length);” 中 1 和 L->length 
代码 的 意思 了 ， 它 就 是 当前 待 排 序 的 序列 最 小 下 标 值 ow 和 最 大 下 标 值 
high ° 


这 一 段 代码 的 核心 是 “pivot=Parti-tion(L,low,high);* 在 执行 它 之 前 ，L.r 的 
数组 值 为 {50,10,90,30,70,40,80,60,20}。Partition 另 数 要 做 的 ， 就 是 先 选 
取 当 中 的 一 个 关键 字 ， 比 如 选择 第 一 个 关键 字 50， 然 后 想 尽 办 法 将 它 
放 到 一 个 位 置 ， 使 得 它 左边 的 值 都 比 它 小 ， 右 边 的 值 比 它 大 ， 我 们 将 
这 样 的 关键 字 称 为 枢 轴 (pivot) ° 


在 经 过 Partition(L,1,9) 的 执行 之 后 ， 数 组 变 成 
{20,10,40,30,50,70,80,60,90}， 并 返回 值 5 给 pivot， 数 字 5 表 明 50 放 置 在 
数组 下 标 为 5 的 位 置 。 此 时 ， 计 算 机 把 原来 的 数组 变 成 了 两 个 位 于 50 左 
和 右 小 数组 {20,10,40,30} 和 {70,80,60,90}， 而 后 的 递归 调 

用 “QSort(L,1,5-1);” 和 “QSort(L,5+1,9);” 语 句 ， 其 实 就 是 在 对 
{20,10,40,30} 和 {70,80,60,90} 分 别 进行 同样 的 Partition 操 作 ， 直 到 顺序 全 
部 正确 为 止 。 


到 了 这 里 ， 应 该 说 理解 起 来 还 不 算 困 难 。 下 面 我 们 就 来 看 看 快速 排序 
By BEA Partition EX ASE EN, ο 


/* 交换 顺序 表 L 中 子 表 的 记录 ， 使 枢 轴 记录 到 位 ， 


/* 此 时 在 它 之 前 (后 ) 的 记录 均 不 大 (小 ) 于 


eo ή 
int Partition(SqList *L, int low, int high) 
η 


int pivotkey; 


/* 用 子 表 的 第 一 个 记录 作 枢 轴 记 录 */ 


pivotkey = L->r[low]; 


/* 从 表 的 两 端 交替 向 中 间 扫 描 */ 


while (low < high) 
{ 
while (low < high && L->r[high] >= pivotkey) 


high--; 


/* 将 比 枢 轴 记 录 小 的 记录 交换 到 低 端 */ 


swap(L, low, high); 
while (low < high && L->r[low] <= pivotkey) 


low++; 


/* 将 比 枢 轴 记 录 大 的 记录 交换 到 高 端 */ 


swap(L, low, high); 
} 
/* 返回 枢 轴 所 在 位 置 */ 


return low; 


} 


1. 程序 开始 执行 ， 此 时 low=1，high=L.length=9。 第 4 行 ， 我 们 将 
Lr[low]=L.r[1=50 赋 值 给 枢 轴 变量 piv-otkey， 如 图 9-9-1 所 示 。 


T 标 0 1 2) 345 4 
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图 9-9-1 


2. 第 5~13 行 为 while 循 环 ， 目 前 low=1<high=9， 执 行内 部 语句 。 


3. 第 7 行 ，L.r[high]=L.r[9]=20*piv-otkey=50， 因 此 不 执行 第 8 行 。 


4. 第 9 行 ， 交 换 L.r[llow] 与 L.r[high] 的 值 ， 使 得 L.r[1]=20，L.r[9]=50。 为 
什么 要 交换 ， 就 是 因为 通过 第 7 行 的 比较 知道 ，L.r[high] 是 一 个 比 
pivotkey=50 ( 即 L.rflow]) 还 要 小 的 值 ， 因 此 它 应 该 交换 到 50 的 左 侧 ， 
如 图 9-9-2 所 示 。 
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图 9-9-2 


5. 第 10 行 ， 当 L.r[low]=L.r[1]=20，Ppiv-otkey=50，L.r[low]<pivotkey， 
因此 第 11 行 ，low++， 此 时 low=2。 继 续 循 环 ，L.r[2]=10<50，1low++， 
此 时 low=3。L.r[3]=90>50， 退 出 循环 。 


6. 第 12 行 ， 交 换 L.r[low]=L.r[3] 与 L.rfhigh]=L.r[9] 的 值 ， 使 得 
L.r[3]=50，L.r[9]=90。 此 时 相当 于 将 一 个 比 50 大 的 值 90 交 换 到 了 50 的 右 
边 。 注 意 此 时 low 已 经 指向 了 3， 如 图 9-9-3 所 示 。 
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图 9-9-3 

7. 继续 第 5 行 ， 因 为 low=3<high=9， 执 行 循环 体 。 

8. 747, “4L.r[high]=L.r1[9]=90, piv-otkey=50, L.r[high]>pivotkey, 
因此 第 8 行 ，high--， 此 时 high=8。 继 续 循 环 ，L.r[8]=60>50，high--， 此 
时 high=7。L.r[7]=80>50，high--， 此 时 high=6。Lr[6]=40<50， 退 出 循 
Ef ο 


9. 第 9 行 ， 交 换 L.r[low]=L.r[3]=50 与 L.rfhigh]=L.r[6]=40 的 值 ， 使 得 
L.r[3]=40，L.r[6]=50， 如 图 9-9-4 所 示 。 
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10. ΒΙΟΙ, 4L.r[low]=L.1[3]=40, piv-otkey=50, L.r[low]<pivotkey, 
因此 第 11 行 ，low++， 此 时 low=4。 继 续 循环 L.r[4]=30<50，low++， 此 
时 low=5。L.r[5]=70>50， 退 出 循环 。 


11. 第 12 行 ， 交 换 L.r[low]=L.r[5]=70 与 L.r[high]=L.r[6]=50 的 值 ， 使 得 
L.r[5]=50，L.r[6]=70， 如 图 9-9-5 所 示 。 
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图 9-9-5 


12. 再 次 循环 。 因 low=5<high=6， 执 行 循环 体 后 ，low=high=5， 退 出 循 
环 ， 如 图 9-9-6 所 示 。 
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图 9-9-6 


13. 最 后 第 14 行 ， 返 回 low 的 值 5。 男 数 执行 完成 。 接 下 来 就 是 递归 调 
用 “QSort(L,1,5-1);” 和 “QSort(L,5+1,9);” 语 句 ， 对 {20,10,40,30} 和 
{70,80,60,90} 分 别 进行 同样 的 Partition 操 作 ， 直 到 顺序 全 部 正确 为 止 。 
我 们 就 不 再 演示 了 。 


通过 这 上 段 代码 的 模拟 ， 大 家 应 该 能 够 明白 ，Partition 函 数 ， 其 实 束 是 将 
选取 的 pivotkey 不 断交 换 ， 将 比 它 小 的 换 到 它 的 左边 ， 比 它 大 的 换 到 它 
,--....------;::; 


9.9.2 ”快速 排序 复杂 度 分 析 


我 们 来 分 析 一 下 快速 排序 法 的 性 能 。 快 速 排 序 的 时 间 性 能 取决 于 快速 
排序 递归 的 深度 ， 可 以 用 递归 树 来 描述 递归 算法 的 执行 情况 。 如 图 9-9- 
7 所 示 ， 它 是 {50,10,90,30,70,40,80,60,20} 在 快速 排序 过 程 中 的 递归 过 

程 。 由 于 我 们 的 第 一 个 关键 字 是 50， 正 好 是 待 排序 的 序列 的 中 间 值 ， 

因此 递归 树 古 平衡 的 ， 此 时 性 能 也 比较 好 。 


图 9-9-7 


在 最 优 情况 下 ，Partition 每 次 都 划分 得 很 均匀 ， 如 果 排 序 n 个 关键 字 ， 

其 递归 树 的 深度 就 为 〈 表 示 不 大 于 x 的 最 大 整数 ) ， 即 仅 需 递归 log ,n 
次 ， 需 要 时 间 为 TO 的 话 ， 第 一 次 Par-tiation 应 该 是 需要 对 整个 数组 扫 
摘 一 通 ， 做 n 次 比较 。 然 后 ， 获 得 的 枢 轴 将 数组 一 分 为 二 ， 那 么 各 目 还 


需要 T(n/2) 的 时 间 (注意 是 最 好 情况 ， 所 以 平分 两 半 ) 。 于 是 不 断 地 划 
分 下 去 ， 我 们 就 有 了 下 面 的 不 等 式 推断 。 


min) εοπ(π A 2 a ony Ul Se) 
TA 7 4)+2n 
T(n) < 4(2T(n / 8) +n / 4) + 2n = 8T(n / 8)+3n 


T(n) < nT(1) + (log 2 n) x n = O(nlogn) 


也 就 是 说 ， 在 最 优 的 情况 下 ， 快 速 排序 算法 的 时 间 复 杂 度 为 Onlogn)。 


在 最 坏 的 情况 下 ， 竺 排序 的 序列 为 正 序 或 者 逆序 ， 每 次 划分 只 得 到 一 
个 比 上 一 次 划分 少 一 个 记录 的 子 序列 ， 注 意 另 一 个 为 空 。 如 有 果 递 归 树 
画 出 来 ， 它 就 是 一 棵 斜 树 。 此 时 需要 执行 n-1 次 递归 调用 ， 且 第 i 次 划分 
需要 经 过 n-i 次 关键 字 的 比较 才能 找到 第 i 个 记录 ， 世 就 是 枢 轴 的 位 置 ， 
因此 比较 次 数 为 sigma(i=1, n-1, n-i)=(n-1)+(n-2)+...+1=n(n-1)/2, RAH 
时 间 复 杂 度 为 O(n?)。 


平均 的 情况 ， 设 枢 轴 的 关键 字 应 该 在 第 k 的 位 置 (1<k<n) , JA: 
] n } n 
T(n)=-Y (1(k-1)4T(n-k))+n=—) T(k)+n 


ΙΙ [| [-) 


由 数学 归纳 法 可 证 明 ， 其 数量 级 为 O(nlogn)。 


就 空间 复杂 度 来 说 ， 主 要 是 递归 造成 的 栈 空 间 的 使 用 ， 最 好 情况 ， 递 
归 树 的 深度 为 log *n， 其 空间 复杂 度 也 就 为 0dtogmn)， 最 坏 情况 ， 需 要 进 
行 n-1 递 归 调 用 ， 其 空间 复杂 度 为 O(n)， 平 均 情况 ， 空 间 复 杂 度 也 为 
O(logn) ° 


可 惜 的 是 ， 由 于 关键 字 的 比较 和 交换 是 跳跃 进行 的 ， 因 此 ， 快 速 排序 
是 一 种 不 稳定 的 排序 方法 。 


99.3 ”快速 排序 优化 
ο η 不 少 可 以 改进 的 地 方 ， 我 们 来 看 一 些 优化 的 


1. 优化 选取 枢 轴 


如 果 我 们 选取 的 pivotkey 是 处 于 整个 序列 的 中 间 人 位置， 那么 我 们 可 以 将 
整个 序列 分 成 小 数 集合 和 大 数 集合 了 。 但 注意 ， 我 刚才 说 的 是 “如 

果 ...... 是 中 间 ”， 那 么 假如 我 们 选取 的 pivotkey 不 是 中 间 数 又 如 何 呢 ? 
比如 我 们 前 面 讲 冒 泡 和 简单 选择 排序 一 直 用 到 的 数组 
{9,1,5,8,3,7,4,6,2} ， 由 代码 第 4 行 “pivotkey=L->r[low];” 知 道 ， 我 们 应 该 
选取 9 作为 第 一 个 枢 轴 pivotkey。 此 时 ， 经 过 一 

轮 “pivot=Partition(L,1,9);” 转 换 后 ， 它 只 是 更 换 了 9 与 2 的 位 置 ， 并 且 返 
回 9 给 pivot， 整 个 系列 并 没有 实质 性 的 变化 ， 如 图 9-9-8 所 示 。 


TRO 123 45 67 8 9 


pivotkey=9 low} | high 


图 9-9-8 


就 是 说 ， 代 码 第 4 行 “pivotkey=L->r[low];” 变 成 了 一 个 潜在 的 性 能 瓶颈 ο 
排序 速度 的 快慢 取决 于 L.r[1] 的 关键 字 人 处 在 整个 序列 的 位 置 ，L.r[1] 太 小 
或 者 太 大 ， 都 会 影响 性 能 (比如 第 一 例子 中 的 50 束 是 一 个 中 间 数 ， 而 第 
二 例子 的 9 就 是 一 个 相对 整个 序列 过 大 的 数 )。 因 为 在 现实 中 ， 答 排序 的 
系列 极 有 可 能 是 基本 有 序 的， 此 时 ， 总 是 固定 选取 第 一 个 关键 字 (其 

实 无 论 是 固定 选取 哪 一 个 位 置 的 关键 字 ) 作为 首 个 枢 轴 就 变 成 了 极为 

不 合理 的 作法 。 


改进 办 法 ， 有 人 提出 ， 应 该 随机 获得 一 个 low 与 high 之 间 的 数 md， 让 它 
的 关键 字 L.r[rmnd] 与 L.rlow] 交 换 ， 此 时 就 不 容易 出 现 这 样 的 情况 ， 这 被 
称 为 随机 选取 枢 轴 法 。 应 该 说 ， 这 在 某 种 程度 上 ， 解 决 了 对 于 基本 有 
序 的 序列 快速 排序 时 的 性 能 瓶 贷 。 不 过 ， 随 机 束 有 些 撞 大 运 的 感觉 ， 
万 一 没 挤 成 功 ， 随 机 到 了 依然 是 很 小 或 很 大 的 关键 字 怎 么 办 呢 ? 


再 改进 ， 于 是 就 有 了 三 数 取 中 (median-of-three) 法 。 即 取 三 个 关键 字 
先进 行 排 序 ， 将 中 间 数 作为 枢 轴 ， 一 般 是 取 左 端 、 右 端 和 中 间 三 个 

数 ， 也 可 以 随机 选取 。 这 样 至 少 这 个 中 间 数 一 定 不 会 是 最 小 或 者 最 大 
的 数 ， 从 概率 来 说 ， 取 三 个 数 均 为 最 小 或 最 大 数 的 可 能 性 是 微乎其微 
的 ， 因 此 中 间 数 位 于 较为 中 间 的 值 的 可 能 性 就 大 大 提高 了 。 由 于 整个 
序列 是 无 序 状态 ， 随 机 选取 三 个 数 和 从 左 中 右 端 取 三 个 数 其 实 是 一 

"ΕΙ eas 因此 随机 生成 不 


我 们 来 看 看 取 左 端 、 右 端 和 中 间 三 个 数 的 实现 代码 ， 在 Partition 函 数 代 
码 的 第 3 行 与 第 4 行 之 间 增 加 这 样 一 段 代 码 。 


int pivotkey; 


/* 计算 数组 中 间 的 元 素 的 下 标 */ 


int m = low + (high - low) / 2; 


if (L->r[low] > L->r[high] ) 


/* 交换 左 端 与 右 端 数据 ， 保 证 左 端 较 小 */ 


swap(L, low, high); 


=h 


if (L->r[m] > L->r[high]) 


/* 交换 中 间 与 右 端 数据 ， 保 证 中 间 较 小 */ 


swap(L, high, m); 


=h 


if (L->r[m] > L->r[low]) 


/* 交换 中 间 与 左 端 数据 ， 保 证 左 端 较 小 */ 


swap(L, m, low); 


a 


/* SEL. r[low] BARES FAA PE 


个 关键 字 的 中 间 值 。 */ 


/* 用 子 表 的 第 一 个 记录 作 枢 轴 记 录 */ 


pivotkey = L->r[low]; 


试想 一 下 ， 我 们 对 数组 {9,15,8,3,7,4,6,2}， 取 左 9、 中 3、 右 2 来 比较 ， 
使 得 L.r[low]=3， 一 定 要 比 9 和 2 来 得 更 为 合理 。 


三 数 取 中 对 小 数组 来 说 有 很 大 的 概率 选择 到 一 个 比较 好 的 pivotkey， 但 
是 对 于 非常 大 的 待 排序 的 序列 来 说 还 是 不 足以 保证 能 够 选择 出 一 个 好 
的 pivotkey， 因 此 还 有 个 办 法 是 所 请 九 数 取 中 (me-dian-of-nine) , © 
先 从 数组 中 分 三 次 取样 ， 每 次 取 三 个 数 ， 三 个 样品 各 取出 中 数 ， 然 后 
从 这 三 个 中 数 当中 再 取出 一 个 中 数 作 为 枢 轴 。 显 然 这 束 更 加 傈 证 了 取 
到 的 pivotkey 是 比较 接近 中 间 值 的 天 键 字 。 有 兴趣 的 同学 可 以 目 己 去 实 
现 一 下 代码 ， 这 里 不 再 详 述 了 。 


2. 优化 不 必要 的 交换 
观察 图 9-9-1 一 图 9-9-6， 我 们 发 现 ，50 这 个 关键 字 ， 其 位 置 变化 是 


1-9-3 一 6-5， 可 其 实 它 的 最 终日 标 就 是 5， 当 中 的 交换 其 实 是 不 需 
要 的 。 因 此 我 们 对 Partition 函 数 的 代码 再 进行 优化 。 


/* 快速 排序 优化 算法 */ 
int Partitioni(SqList *L, int low, int high) 
ξ 


int pivotkey; 


/* 这 里 省 略 三 数 取 中 代码 */ 


/* 用 子 表 的 第 一 个 记录 作 枢 轴 记 录 */ 


pivotkey = L->r[low]; 


/* 将 枢 轴 关键 字 备份 到 L->r[0] */ 


L->r[0] = pivotkey; 


/* 从 表 的 两 端 交 蔡 向 中 间 扫 描 */ 


while (low < high) 
iL 
while (low < high && L->r[high] >= pivotkey) 


high--; 


/* 采用 准 换 而 不 是 交换 的 方式 进行 操作 */ 


L->r[low] = L->r[high]; 


while (low < high && L->r[low] <= pivotkey) 


lowt++; 


/* RFA ESR MOA ze AERA 7 ETRE */ 
L->r[high] = L->r[low]; 
} 


/* 将 枢 轴 数 值 替换 回 L,r[Low] */ 


L->r[low] = L->r[0]; 


/* 返回 枢 轴 所 在 位 置 */ 


return low; 


注意 代码 中 加 粗 部 分 的 改变 。 我 们 事实 将 piv-otkey 备 份 到 L.r[0] 中 ， 然 
后 在 之 前 是 swap 时 ， 只 作 准 换 的 工作 ， 最 终 当 low 与 high 会 合 ， 即 找到 
了 枢 轴 的 位 置 时 ， 再 将 Lr[0] 的 数值 赋值 回 L.r[low]。 因 为 这 当中 少 了 多 
次 交换 数据 的 操作 ， 在 性 能 上 又 得 到 了 部 分 的 提高 。 如 图 9-9-9 所 示 。 


一 -注意 这 里 L.r[0]=Ppivotkey; 
ἘΠ OF 1 2 3 * ο F BS FB 
so | 10 | 90 | 30 | 70 | 40 | so | 60 | 20 | 


high 


pivotkey=50 low 
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pivotkey=50 low 
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pivotke y=S0 low 
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pivotke y=50 low high 


下 标 ο 1 2 3 4 5 6 


7 8 9 
10 | 40 | 30 | 70 | 70 | 80 | 60 | 90 | 


low high 


pivotke y=S50 


”注意 这 里 L.r[low]=L.r[O]: 


图 9-9-9 
3， 优 化 小 数组 时 的 排序 方案 


对 于 一 个 数学 科学 家 、 博 士 生 导 师 ， 他 可 以 攻克 世界 性 的 难题 ， 可 以 
培养 最 优秀 的 数学 博士 ， 但 让 他 去 教 小 学 生 “1+1=2” 的 算术 课程 ， 那 还 
真 未 必 会 比 常年 在 小 学 里 耕耘 的 数学 老师 教 得 好 。 换 句 话说 ， 大 材 小 
用 有 时 会 变 得 反而 不 好 用 。 刚 才 我 谈 到 了 对 于 非常 六 的 数组 的 解决 办 
法 。 那 么 相反 的 情况 ， 如 条 数组 非特 小 ， 其 实 快速 排序 反而 不 如 直接 
插入 排序 来 得 更 好 〈 直 接 插 入 是 简单 排序 中 性 能 最 好 的 ) 。 其 原因 在 
于 快速 排序 用 到 了 递归 操作 ， 在 大 量 数据 排序 时 ， 这 点 性 能 影响 相对 
于 它 的 整体 算法 优势 而 言 是 可 以 忽略 的 ， 但 如 果 数 组 只 有 几 个 记录 需 
要 排序 时 ， 这 就 成 了 一 个 大 炮 打 蚊子 的 大 问题 。 因 此 我 们 需要 改进 一 
下 QSort 函 数 。 


#define MAX_LENGTH_INSERT_SORT 7 /* 数组 长 度 阀 值 */ 


/* 对 顺序 表 L 中 的 子 序列 L.r[low,. .high] 作 快速 排序 */ 


void QSort(SqList &L, int low, int high) 

{ 
int pivot, 
if ((high - low) > MAX_LENGTH_INSERT_SORT) 
{ 


/* 当 high-low 大 于 常数 时 用 快速 排序 */ 


/* 将 L.r[low. .high] 一 分 为 二 ， */ 


ee 出 


Ba 


轴 值 pivot */ 


pivot = Partition(L, low, high); 


/* 对 低 子 表 递 归 排 序 */ 


Ὁ5οπε( ον mM DivVo = 


/* 对 高 子 表 递 归 排 序 */ 


OSore (D pivo oy 


/* 当 high-low 小 于 等 于 常数 时 用 直接 插入 排序 */ 


InsertSort(L); 


} 


我 们 增加 了 一 个 判断 ， 当 high-low 不 大 于 某 个 常数 时 (有 资料 认为 7 比 
较 合适 ， 也 有 认为 50 更 合理 ， 实 际 应 用 可 适当 调整 ， 就 用 直接 插入 
排序 ， 这 样 就 能 保证 最 大 化 地 利用 两 种 排序 的 优势 来 完成 排序 工作 。 


4. 优化 递归 操作 

大 家 知道 ， 递 归 对 性 能 是 有 一 定 影响 的 ，QSort 函 数 在 其 尾部 有 两 次 递 
归 操 作 。 如 果 待 排序 的 序列 划分 极端 不 平衡 ， 递 归 深 度 将 趋 近 于 n， 而 
不 是 平衡 时 的 log 

2n， 这 殊 不 仅仅 是 速度 快慢 的 问题 了 。 栈 的 大 小 是 很 有 限 的 ， 每 次 弟 
归 调 用 都 会 耗费 一 定 的 栈 空间 ， 画 数 的 参数 越 多 ， 每 次 递归 耗费 的 空 
间 也 越 多 。 因 此 如 采 能 减少 递归 ， 将 会 大 大 提高 性 能 。 


于 十 我 们 对 QSort 实 施 尾 递归 优化 。 来 看 代码 。 


/* 对 顺序 表 L 中 的 子 序列 L.r[low. .high] 作 快速 排序 */ 


void QSorti(SqList *L, int low, int high) 
{ 
int pivot; 
if ((high - low) > MAX_LENGTH_INSERT_SORT) 


£ 


while (low < high) 
€ 


/* L.r[low. .high] 一 分 为 二 ，*/ 


/* ΤΗ 


[δει 


轴 值 pivot */ 


pivot = Partitioni(L, low, high); 


/* 对 低 子 表 递归 排序 */ 


OSGREN(E που PIVO απ) 


/* ΕΒΙΗ */ 


low = pivot + 1; 


} 
else 
InsertSort(L); 


} 


当 我 们 将 if 改 成 while 后 〈《 见 加 粗 代 码 部 分 ) ， 因 为 第 一 次 递归 以 后 ， 变 
量 low 瓯 没有 用 处 了 ， 所 以 可 以 将 pivot+1 赋 值 给 low， 再 循环 后 ， 来 一 
次 Partition(L,low,high)， 其 效果 等 同 于 “QSort(L,pivot+1,high);”。 结果 相 
ο ος 从 而 提高 

Fe VV’ 能 


在 现实 的 应 用 中 ， 比 如 C++、java、 PHP、C#、VB、JavaScript 等 都 有 
对 快速 排序 算法 的 实现 ， 实 现 方式 上 略 有 不 同 ， 但 基本 上 都 是 在 我 们 
讲解 的 快速 排序 法 基础 上 的 精神 体现 。 


5， 了 不 起 的 排序 算法 


我 们 现在 学 过 的 排序 算法 ， 有 按照 实现 方法 分 类 命名 的 ， 如 简单 选择 
排序 、 直 接 插 入 排序 、 归 并 排序 ， 有 按照 其 排序 的 方式 类 比 现 实 世 界 
命名 的 ， 比 如 冒 泡 排 序 、 堆 排序 ， 还 有 用 人 名 命名 的 ， 比 如 希 尔 排 
序 。 但 是 刚才 我 们 讲 的 排序 ， 却 用 “快速 "来 命名 ， 这 也 束 意 味 着 只 
再 有 人 找到 更 好 的 排序 法 ， 此 “快速 ? 吏 会 名 不 符 实 ， 不 过 ， 至 少 今 
天 ，TonyHoare 发 明 的 快速 排序 法 经 过 多 次 的 优化 后 ， 在 整体 性 能 
依然 是 排序 算法 王者 ， 我 们 应 该 要 好 好 研究 并 掌握 它 。 


9.10 ”总结 回 顾 


本 章 内 容 只 是 在 讲 排序 ， 我 们 需要 对 已 经 提 到 的 各 个 排序 算法 进行 对 
比 来 总 结 回顾 。 


首先 我 们 讲 了 排序 的 定义 ， 并 提 到 了 排序 的 稳定 性 ， 排 序 稳定 对 于 某 
些 特殊 需求 来 说 是 至 天 重要 的 ， 因 此 在 排序 算法 中 ， 我 们 需要 关注 此 
算法 的 稳定 性 如 何 。 


我 们 根据 将 排序 记录 是 否 全 部 被 放置 在 内 存 中 ， 将 排序 分 为 内 排序 与 
外 排序 两 种 ， 外 排序 需要 在 内 外 存 之 间 多 次 交换 数据 才能 进行 。 我 们 
本 章 主要 讲 的 是 内 排序 的 算法 。 


根据 排序 过 程 中 借助 的 主要 操作 ， 我 们 将 内 排序 分 为 : 插入 排序 、 交 
换 排 序 、 选 择 排序 和 归并 排序 四 类 。 之 后 介绍 的 7 种 排序 法 ， 就 分 别 是 
各 种 分 类 的 代表 算法 。 


HEF 


HARES πὶ ΜΗΝΑ H 
-n e 

Ἢ. ΒΜ Ἢ. ή ΠῚ ΜΗΗ ΘΉῚ 
图 9-10-1 


事实 上 ， 目 前 还 没有 十 全 十 美的 排序 算法 ， 有 优点 束 会 有 缺点 ， 即 使 
征 快 速 排序 法 ， 也 只 是 在 整体 性 能 上 优越 ， 它 也 存在 排序 不 稳定 、 需 
要 大 量 辅助 空间 、 对 少量 数据 排序 无 优势 等 不 足 。 因 此 我 们 就 来 从 多 
个 角度 来 剖析 一 下 提 到 的 各 种 排序 的 长 与 短 。 


我 们 将 7 种 算法 的 各 种 指标 进行 对 比 ， 如 表 9-10-1 所 示 。 


排序 方法 
BAHR 


简单 选择 排序 
下 接 插入 排序 


ἘΜ 
ἘΠ 

月 并 排序 
快速 排序 


表 9-10-1 


从 算法 的 简单 性 来 看 ， 我 们 将 7 种 算法 分 为 两 类 : 


。 简 单 算法 ， 冒 泡 、 简 单 选择 、 
` 堆 、 归 并 、 


从 平均 情况 来 看 ， 显 然 最 后 3 种 改进 算法 要 胜 过 


。 改进 算法 : 


平均 情况 

ή 

olr’ 

oln? 
O(nlogn) ~ On ) 
O(nlogn) 
O(nlogn) 
O(nlogn) 


FIR 


前 3 种 简单 算法 。 


从 最 好 情况 看 ， 


最 好 情况 
O(n) 
olr’ 
O(n) 
oln”) 
O(nlogn) 
O(nlogn) 
O(nlogn) 


最 十 情况 
olr’ 
olr’ 


O(nlogn) 
O(nlogn) 
olr’ 


直接 插入 。 
快速 。 


辅助 空间 
Ot 
0/1) 
0/1) 
0/1) 
0(1) 
O(n) 
O(logn) ~ O(n) 


希 尔 排序 ， 并 远 远 胜 过 


Beri SelM EL Betis ΛΠΕ Se 筹 ， 也 就 古 说 ， 如 


, 


从 最 坏 情况 看 ， 
Ες 


是 基本 有 序 ， 反 而 不 应 该 考虑 4 种 复杂 的 改进 算 


堆 排 序 与 归并 排序 又 强 过 快速 排序 以 及 其 他 简单 排 


从 这 三 组 时 间 复 杂 度 的 数据 对 比 中 ， 我 们 可 以 得 出 这 样 一 个 认识 。 堆 
排序 和 归并 排序 就 像 两 个 参加 奥数 考试 的 优等 生 ， 心 理 素质 强 ， 发 挥 
稳定 。 而 快速 排序 像 是 很 情绪 化 的 天 才 ， 心 情 好 时 表现 极 佳 ， 碰 到 较 
粳 糕 环境 会 变 得 差强人意 。 但 是 他 们 如 果 都 来 比赛 计算 个 位 数 的 加 减 
法 ， 它 们 反而 算 不 过 成 绩 极 普 通 的 冒 泡 和 直接 插入。 


从 空间 复杂 度 来 说 ， 归 并 排序 强调 要 马 跑 得 快 ， 就 得 给 马 吃 个 钝 。 快 
速 排序 也 有 相应 的 空间 有 要求 ， 反 而 堆 排序 等 却 都 是 少量 索取 ， 大 量 付 
出 ， 对 空间 要 求 是 O(1)。 如 果 执 行 算 法 的 软件 所 处 的 环境 非常 在 乎 内 
ο ， 选 择 归 并 排序 和 快速 排序 就 不 是 一 个 较 好 的 决策 


从 稳定 性 来 看 ， 归 并 排序 独占 鳌头 ， 我 们 前 面 也 说 过 ， 对 于 非常 在 乎 
排序 稳定 性 的 应 用 中 ， 归 并 排序 是 个 好 算法 。 


从 待 排序 记录 的 个 数 上 来 启 ， 待 排序 的 个 数 n 越 小 ， 采 用 简单 排序 方法 
越 合适 。 反 之 ，n 越 大 ， 采 用 改进 排序 方法 越 合 适 。 这 也 就 是 我 们 为 什 
么 对 快速 排序 优化 时 ， 增 加 了 一 个 阀 值 ， 低 于 阀 值 时 换 作 直接 插入 排 
序 的 原因 。 


从 表 9-10-1 的 数据 中 ， 似 乎 简单 选择 排序 在 3 种 简单 排序 中 性 能 最 差 ， 
其 实 也 不 完全 是 ， 比 如 ， 如 果 记 录 的 关键 字 本 身 信 息 量 比较 大 ( 例 
如 ， 关 键 字 都 是 数 十 位 的 数字 ) ， 此 时 表明 其 占用 存储 空间 很 大 ， 这 
样 移动 记录 所 花费 的 时 间 也 就 越 多 ， 我 们 给 出 3 种 简单 排序 算法 的 移动 
次 数 比 较 ， 如 表 9-10-2 所 示 。 


HPD = 最 好 情况 = 


直接 括 入 排序 tae O(n) Οή 


表 9-10-2 


你 会 发 现 ， 此 时 人 简单 选择 排序 束 变 得 非常 有 优势 ， 原 因 也 就 在 于 ， 它 
征 通 过 大 量 比较 后 选择 明确 记录 进行 移动 ， 有 的 放 天 。 因 此 对 于 数据 
量 不 是 很 大 而 记录 的 关键 字 信息 量 较 大 的 排序 要 求 ， 简 单 排序 算法 是 
男 外 ， 记 录 的 关键 子 信息 量 大 小 对 那 四 个 改进 算法 影响 不 


总 之 ， 从 绕 合 各 项 指标 来 说 ， 经 过 优化 的 快速 排序 是 性 能 最 好 的 排序 
算法 ， 但 是 不 同 的 场合 我 们 也 应 该 考虑 使 用 不 同 的 算法 来 应 对 它 。 


9.11 结尾 语 

学 完 排 序 ， 你 能 够 感受 到 ， 我 们 的 算法 研究 者 们 都 是 在 “似乎 不 可 
能 ”的 情况 下 ， 逐 步 提高 排序 算法 的 性 能 的 。 在 剩 下 的 几 分 钟 时 间 里 ， 
Bel | FRR HBT eal, RS PGA BEE AT ΒΕ ο 


W Ha FE 9-1-1 A Be IRI REER? 


图 9-11-1 


大 家 举 手 很 快 ， 因 为 绝 大 多 数 同学 应 该 都 看 过 这 道 题目 。 没 有 做 过 题 
目的 同学 通 单 十 有 八 九 会 落 入 一 个 小 小 的 陷阱 ， 在 九 个 点 围 成 的 框 中 
打转 转 ， 然 后 发 现 至 少 要 五 段 以 上 的 直线 才能 连 成 。 结 果 是 ， 要 找到 
答案 ， 必 须 在 思维 上 突破 这 九 个 点 所 围 成 的 框框 的 限制 ， 如 图 9-11-2 所 
ZR 5 


图 9-11-2 


如 朱智 力 题 这 束 结 束 了 ， 那 融 不 考 大 家 了 “。 现 在 我 的 问题 是 如 何 做 到 
三 段 直 线 一 笔 将 这 九 个 点 连 起 来 ? 


此 时 ， 大 家 都 在 交 头 接 耳 ， 心 里 一 定 想 着 , “这 怎么 可 能 ? ”我 来 公布 
答案 ， 那 就 是 用 一 条 “Z? 字 线 即 可 一 笔 连 成 。 也 许 ， 最 快 找 出 这 个 答案 
的 是 那些 没有 学 过 数学 的 孩子 。 作 为 成 人 ， 我 们 已 被 另 一 些 “ 框 框 ?所 
框 住 大 脑 。 那 就 是 数学 上 有 一 条 基本 公理 :两 条 平行 线 永 不 相交 。 男 
外 数学 上 有 另 一 个 基本 假设 : 点 没有 大 小 。 可 在 现实 中 任何 一 点 都 会 
有 大 小 。 帘 和 破 这 一 限制 ， 只 要 无 限 延长 *Z” 字 三 段 线 ， 九 点 必 可 一 笔 

连 。 来 看 图 9-11-3。 


图 9-11-3 
有 同学 说 ， 我 图 中 的 点 比 刚才 的 要 大 ， 这 不 符 已 。” 


本 半 的 结束 ， 其 实 也 就 是 数据 结构 这 门 课 的 结束 了 。 数 据 结构 和 算 
法 ， 还 有 很 多 内 容 我 们 并 没有 涉及 。 要 想 真 正 掌 握 数 据 结构 ， 并 把 它 
应 用 到 工作 中 ， 你 们 的 路 还 很 长 。 


我 们 生命 中 ， 矛 盾 和 困惑 往往 一 直 伴 随 。 很 多 同学 来 学 习 数 据 结构 ， 

其 实 并 不 是 真 的 明 昌 它 的 重要 性 ， 通 音 只 是 因为 学 校 开 了 这 门 课 ， 而 
不 得 不 来 这 里 弄 个 PASS， 过 后 ， 真 到 需要 用 时 ， 却 发 现 力 不 从 心 而 追 
悔 旭 及。 比如 图 9-11-4 所 示 ， 斐 剧 通 和 束 是 这 样 产 生 的 。 因 此 尽管 现在 
征 课 程 的 最 后 ， 对 于 个 别 没有 重视 这 门 课 的 同学 来 说 有 些 晚 了 ， 我 还 
是 想 再 亡羊补牢 : 数据 结构 和 算法 对 于 程序 员 的 职业 人 生来 说 ， 那 就 
征 两 个 圆圈 的 交集 部 分 ， 用 心 去 掌握 它 ， 你 的 编程 之 路 将 会 是 坦途 。 


我 觉得 应 该 学 习 的 知识 


能 够 赚钱 的 知识 


图 9-11-4 
最 后 送 大 家 电影 《 当 六 福来 敲 门 》 中 的 一 句 话 : 


You got a dream, you gotta protect it.People can't do something themselves, 

theywanna tell you you can't do it. If you wantsomething, go get it. Period. 
(RIA BEATE, PAARL E ο ΜΙΛΙΑ ΜΗΙΗΗΗΥ 5, ΤΠ, 

ΙΤ 你 也 不 能 。 如 果 你 想 要 些 什么 ， 就 得 去 努力 争取 。 就 这 
£ | 


同学 们 ， 再 见 ! 
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